2021-05-12 14:32:11
Python讀取多列資料以及用matplotlib製作圖表方法範例
多列資料的讀入以及處理
這次我們用到的資料是煤炭5500周價格的最高價和最低價。左側為價格的資料表格,右側為日期。
一、匯入資料
這裡我們就直接跳過講解,如有不懂的,詳見上一篇部落格。見程式碼。
import matplotlib.pyplot as plt import re plt.rcParams['font.sans-serif'] = ['SimHei'] # 設定字型 plt.rcParams['axes.unicode_minus'] = False # 設定正負號 # 匯入資料,日期 with open('日期.csv', encoding='gbk') as oo: day = oo.read() day_str = day.replace('n', ',') # 換行替換成逗號 day_list = re.split('[,]', day_str) list_days = [] for s in range(len(day_list)-1): # 獲得時間 list_days.append(day_list[s]) # 將x轉換成時間型別 # 匯入資料,金額 with open('煤炭5500周價格波動資料.csv', encoding='gbk') as pp: sk = pp.read() ll = sk.replace('n', ',') # 換行替換成逗號 list_1 = re.split('[,]', ll) # 分割資料 list_2 = [] for s in range(len(list_1)-1): list_2.append(int(float(list_1[s])))
現在我們已經講資料讀取到相關的列表裡,輸出一下。
輸出結果:
['2019/12/27', '2019/12/20', '2019/12/13', '2019/12/6', '2019/11/29', '2019/11/22', '2019/11/15', '2019/11/8', '2019/11/1', '2019/10/25', '2019/10/18', '2019/10/11', '2019/9/27', '2019/9/20', '2019/9/12', '2019/9/12', '2019/9/6', '2019/8/30', '2019/8/23', '2019/8/16', '2019/8/9', '2019/8/2', '2019/7/26', '2019/7/19', '2019/7/12', '2019/7/5', '2019/6/28', '2019/6/21', '2019/6/14', '2019/6/7', '2019/5/31', '2019/5/24', '2019/5/17', '2019/5/10', '2019/4/26', '2019/4/19', '2019/4/12', '2019/4/5', '2019/3/29', '2019/3/22', '2019/3/15', '2019/3/8', '2019/3/1', '2019/2/22', '2019/2/15', '2019/2/1', '2019/1/25', '2019/1/18', '2019/1/18', '2019/1/11', '2019/1/4', '2018/12/28']
[550, 555, 550, 555, 550, 555, 550, 555, 550, 555, 550, 555, 550, 555, 550, 555, 560, 565, 570, 575, 575, 580, 580, 585, 585, 590, 585, 590, 585, 590, 585, 590, 580, 585, 580, 585, 580, 590, 575, 585, 580, 590, 595, 600, 590, 600, 590, 595, 600, 605, 605, 615, 600, 610, 590, 600, 590, 600, 590, 600, 595, 600, 610, 620, 615, 620, 615, 620, 615, 625, 620, 625, 630, 640, 620, 630, 620, 625, 620, 630, 625, 630, 635, 645, 615, 625, 600, 605, 600, 605, 585, 590, 590, 595, 590, 595, 590, 595, 580, 590, 585, 595, 575, 580]
二、處理價格資料
我們可以看到0,2,4,6,8.......等偶數位的數值是周最低價,而單數位的數值是周最高價。我們可以用迴圈的方式讀取到相關的資料。
程式碼如下。
這樣就可以把資料進行分組了。以此類推,可以匯入多列資料。
根據觀察可以看到,時間列表是以降序的方式排列的,我們需要將資料轉置過來,讓列表資料改為升序。方法一、調整匯入的CSV檔案的資料順序。方法二、我們引入reversed()函數。該函數有兩種寫法,作用主要是將列表,range(),字典裡的資料進行逆向排列。
逆轉物件:list_x 寫法一、 xxx = reversed(list_x) 寫法二、 直接使用 list(reversed(list_x))
aaa = reversed(list_average) 轉置一個作為樣例 # 以上分割取得list_high,low,average # 設定x軸,y軸標籤,設定表格標題 plt.xlabel('時間') plt.ylabel('價格') plt.title('最高價/最低價/均價週期波動圖') plt.legend(loc='upper right') plt.figure(figsize=(9, 8))輸出圖片大小900px*800px
圖表製作
需要的資料我們已經處理好了,接著就是生成圖表。
import matplotlib.pyplot as plt import re plt.rcParams['font.sans-serif'] = ['SimHei'] # 設定字型 plt.rcParams['axes.unicode_minus'] = False # 設定正負號 # 匯入資料,日期 with open('日期.csv', encoding='gbk') as oo: day = oo.read() day_str = day.replace('n', ',') # 換行替換成逗號 day_list = re.split('[,]', day_str) list_days = [] for s in range(len(day_list)-1): # 獲得時間 list_days.append(day_list[s]) print(list_days) # 將x轉換成時間型別 # 匯入資料,金額 with open('煤炭5500周價格波動資料.csv', encoding='gbk') as pp: sk = pp.read() ll = sk.replace('n', ',') # 換行替換成逗號 list_1 = re.split('[,]', ll) # 分割資料 list_2 = [] for s in range(len(list_1)-1): list_2.append(int(float(list_1[s]))) print(list_2) list_high = [] # 最高 list_low = [] # 最低 list_average = [] # 均值 for k in range(len(list_2)): if k % 2 == 0: list_low.append(list_2[k]) list_average.append((list_2[k]+list_2[k+1])/2) else: list_high.append(list_2[k]) aaa = reversed(list_average) # 以上分割取得list_high,low,average # 設定x軸,y軸標籤,設定表格標題 plt.xlabel('時間') plt.ylabel('價格') plt.title('最高價/最低價/均價週期波動圖') # 設定標註 plt.figure(figsize=(9, 8)) # 製作折現圖 plt.plot(range(len(list_low)), list(reversed(list_high)), label='最高價', color='brown',marker='o',markerfacecolor='c',markersize='5') plt.plot(range(len(list_low)), list(reversed(list_low)), label='最低價', color='skyblue',marker='s',markerfacecolor='r',markersize='5') plt.plot(range(len(list_low)), list(reversed(list_average)), label='均價', color='lawngreen',marker='h',markerfacecolor='coral',markersize='5') # 設定標註 plt.legend(loc='upper right') # 右上upper right 右下lower right plt.show()
這是到目前我們製作出來的折線圖
替換x軸座標點更改成日期
這裡我們使用到plt.xticks()
書寫格式: plt.xticks(被替換的數值(資料長的的列表),替換的資料,資料方向(預設橫向)) plt.xticks(range(len(list_low)), list(reversed(list_days)), rotation='vertical') vertical:數值方向,也可以寫角度。
到這了我們就完成了全部的程式碼。
結束:最終程式碼
import matplotlib.pyplot as plt import re plt.rcParams['font.sans-serif'] = ['SimHei'] # 設定字型 plt.rcParams['axes.unicode_minus'] = False # 設定正負號 # 匯入資料,日期 with open('日期.csv', encoding='gbk') as oo: day = oo.read() day_str = day.replace('n', ',') # 換行替換成逗號 day_list = re.split('[,]', day_str) list_days = [] for s in range(len(day_list)-1): # 獲得時間 list_days.append(day_list[s]) print(list_days) # 將x轉換成時間型別 # 匯入資料,金額 with open('煤炭5500周價格波動資料.csv', encoding='gbk') as pp: sk = pp.read() ll = sk.replace('n', ',') # 換行替換成逗號 list_1 = re.split('[,]', ll) # 分割資料 list_2 = [] for s in range(len(list_1)-1): list_2.append(int(float(list_1[s]))) print(list_2) list_high = [] # 最高 list_low = [] # 最低 list_average = [] # 均值 for k in range(len(list_2)): if k % 2 == 0: list_low.append(list_2[k]) list_average.append((list_2[k]+list_2[k+1])/2) else: list_high.append(list_2[k]) aaa = reversed(list_average) # 以上分割取得list_high,low,average # 設定x軸,y軸標籤,設定表格標題 plt.xlabel('時間') plt.ylabel('價格') plt.title('最高價/最低價/均價週期波動圖') # 設定標註 plt.figure(figsize=(9, 8)) plt.xticks(range(len(list_low)), list(reversed(list_days)), rotation='vertical') # 設定折現圖 plt.plot(range(len(list_low)), list(reversed(list_high)), label='最高價', color='brown',marker='o',markerfacecolor='c',markersize='5') plt.plot(range(len(list_low)), list(reversed(list_low)), label='最低價', color='skyblue',marker='s',markerfacecolor='r',markersize='5') plt.plot(range(len(list_low)), list(reversed(list_average)), label='均價', color='lawngreen',marker='h',markerfacecolor='coral',markersize='5') # 設定標註 plt.legend(loc='upper right') plt.show()
結果示意圖:
總結
到此這篇關於Python讀取多列資料以及用matplotlib製作圖片的文章就介紹到這了,更多相關Python讀取多列資料用matplotlib製作圖片內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章