# W02_2 資料視覺化2

----
## 應用練習: 高雄市空氣品質監測數據

- https://data.gov.tw/dataset/104783

- 資料資源欄位: 
    - Name(測站名稱)、Date(監測日期)、TSP(總懸浮微粒μg/m3)、PM10(懸浮微粒μg/m3)、Chloride(氯鹽μg/m3)、Nitrate(硝酸鹽μg/m3)、Sulfate(硫酸鹽μg/m3)、Lead(鉛μg/m3)、Dust(落塵量-公噸/平方公里/月)

- 檔案格式: CSV

- 編碼格式: UTF-8

In [None]:
import requests

In [None]:
url = 'https://data.kcg.gov.tw/dataset/e9aa2660-c4eb-46e1-a4fd-758f59c70e67/resource/ed5eacda-ee80-44b4-aa9a-88bbaf054512/download/2018humanstation.csv'

- 請試著寫程式把此 csv 資料取回來

In [None]:
# 請填入程式


- 如果你不方便抓資料，或是資料連結已經遺失，可以直接讀檔案

In [None]:
file = open('2018_kh_data.csv')
cr = csv.reader(file)
data_list = list(cr)

In [None]:
# 更好的寫法!
with open('2018_kh_data.csv', 'r') as f:
    cr = csv.reader(f)
    data_list = list(cr)
data_list[0:5]

----
## 讓我們開始來繪圖吧!

In [None]:
data_list[:3]

### 把資料依各月份整理出來

- 資料資源欄位: 
    - Name(測站名稱)
    - Date(監測日期)
    - TSP(總懸浮微粒μg/m3)
    - PM10(懸浮微粒μg/m3)
    - Chloride(氯鹽μg/m3)
    - Nitrate(硝酸鹽μg/m3)
    - Sulfate(硫酸鹽μg/m3)
    - Lead(鉛μg/m3)
    - Dust(落塵量-公噸/平方公里/月)

- 先試著整理大社工業區的資料

In [None]:
data_list[1][0], data_list[1][2]

In [None]:
tsp_list = []
for item in data_list[1:]:
    name = item[0]
    date = item[1]
    tsp = item[2]
    if name == '大社工業區':
        tsp_list.append(int(tsp))


In [None]:
len(tsp_list), tsp_list

In [None]:
%matplotlib inline

In [None]:
import matplotlib.pyplot as plt
plt.plot(range(1, 13), tsp_list)
plt.xlabel('month')
plt.ylabel('Dust')


- 如果你需要格線

In [None]:
import matplotlib.pyplot as plt
plt.plot(range(1, 13), tsp_list)
plt.xlabel('month')
plt.ylabel('Dust')
plt.grid()

### 換個顯示方式! 哇!!怎…麼…

In [None]:
import matplotlib.pyplot as plt
plt.plot(range(1, 13), tsp_list)
plt.xlabel('月份')
plt.ylabel('總懸浮微粒μg/m^3')
plt.grid()

### 處理中文字的問題

- ref: https://free.com.tw/google-noto-fonts/
- google提供的免費字型: https://fonts.google.com/
    * ref. from: [this](https://github.com/victorgau/python_investment/blob/master/3-1%20%E6%8A%93%E5%8F%96%E8%B2%A1%E5%8B%99%E5%A0%B1%E8%A1%A8.ipynb?fbclid=IwAR0D4vHlYGiPB02uu00-8x6A_HgqZO6V7u9XFhsSbS7EG0eGr9qATHoAcu4)

In [None]:
#使用colab引入字型檔前，需要先使用這行來上傳檔案
from google.colab import files
uploaded = files.upload()

In [None]:
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties
font = FontProperties(fname=r"NotoSansTC-Regular.otf", size=14)

months = list(range(1, 13))
plt.plot(months, tsp_list)
plt.title('懸浮微粒趨勢圖', fontproperties = font)
plt.xlabel('月份', fontproperties = font)
plt.ylabel('總懸浮微粒 μg/m^3', fontproperties = font)
plt.grid()

- 再整理一站出來，並把圖畫在一起

In [None]:
tsp_list2 = []
for item in data_list[1:]:
    name = item[0]
    date = item[1]
    tsp = item[2]
    if name == '西子灣中山大學':
        tsp_list2.append(int(tsp))
tsp_list2

In [None]:
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties
font = FontProperties(fname=r"NotoSansTC-Regular.otf", size=14)

months = list(range(1, 13))
plt.plot(months, tsp_list, 'b-o')
plt.plot(months, tsp_list2, 'r:v')
plt.xlabel('月份', fontproperties = font)
plt.ylabel('總懸浮微粒μg/m^3', fontproperties = font)
plt.grid()

- 進一步把圖例說明也加上去

In [None]:
plt.plot(months, tsp_list, 'b-o', label='大社工業區')
plt.plot(months, tsp_list2, 'r--.', label='西子灣中山大學')
plt.xlabel('月份', fontproperties = font)
plt.ylabel('總懸浮微粒μg/m^3', fontproperties = font)
plt.legend()

In [None]:
plt.plot(months, tsp_list, 'b-o', label=u'大社工業區')
plt.plot(months, tsp_list2, 'r--.', label=u'西子灣中山大學')
plt.xlabel('月份', fontproperties = font)
plt.ylabel('總懸浮微粒μg/m^3', fontproperties = font)
plt.legend(prop=font)


### 整理全部的資料，並畫出來

### 練習題：請畫出多筆資料的趨勢圖
- plt.subplots(figsize=(12,8)): 可以把圖變大
- fig, ax1 = plt.subplots(figsize=(12,8), dpi=120)
- plt.legend(prop=font, bbox_to_anchor=(1.0, 1.0)) 可以強制指定圖例的位置

### 為何前面要使用 None 來填充沒資料的欄位

In [None]:
fig, ax1 = plt.subplots(figsize=(12,8))

plt.plot(months, tsp_data['大寮區公所'], '-o', label='大寮區公所')
plt.plot(months, tsp_data['大樹監測站'], '-o', label='大樹監測站')
plt.plot(months, tsp_data['勞工博物館'], '-o', label='勞工博物館')


plt.xlabel('月份', fontproperties = font)
plt.ylabel('總懸浮微粒μg/m^3', fontproperties = font)
#plt.legend(prop=font, bbox_to_anchor=(1.0, 1.0))
plt.legend(prop=font)
