[The Python Graph Gallery](https://www.python-graph-gallery.com/)、[Matplotlib 官網](https://matplotlib.org/api/artist_api.html#module-matplotlib.lines)

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# 一、Matplotlab 兩種繪圖方式 
## 1. pyplot模組 (類似 Matlab)

pyplot 是將 Matplotlab 的物件導向函式庫再包裝成類似 Matlab 的函數式 API ，將許多繪圖物件的複雜結構隱藏起來，並透過有限狀態機 (state machine) 來追蹤目前圖表與子圖的狀態，呼叫 pyplot 所提供函數即可透過簡單的設定實現快速繪圖，非常適合用一般的資料圖形化繪圖 (但不適合用在大型程式設計) 。

(1) 在繪圖區上繪圖：plt.plot(x, y)\
(2) 設定圖行屬性：plt.xticks()、plt.yticks()、plt.xlabel()、plt.ylabel()、plt.xlim()、plt.ylim()、plt.legend()、plt.title()\
(3) 設定次Y軸與否：pd.DataFrame.plot(secondary_y=True)、pd.DataFrame.plot(secondary_y=[0])\
(4) 存成圖片：plt.savefig('sample.jpg')\
(5) 顯示圖形：plt.show()

In [None]:
x = np.linspace(0, 5, 20)

plt.figure(figsize = (6, 6))

plt.plot(x, x**3, '+', label = 'x**3')               #輸入資料，設定圖表類型，以及線的記號
plt.scatter(x, x**2, label = 'x**2')

plt.title('Simple Plot')                             #設定標題
plt.xlabel('x label')                                #設定x軸標題
plt.ylabel('y label')                                #設定y軸標題

plt.xlim(0, 6)                                       #設定x軸範圍
plt.ylim(0, 150)                                     #設定y軸範圍

plt.xticks(np.arange(0, 6, 0.5), labels = [], rotation = 45)        #設定x軸刻度和標籤
plt.yticks(np.arange(0, 150, 10), labels = [])       #設定y軸刻度和標籤

plt.grid(True)                                       #顯示背後格線
plt.legend(loc = 7)                                  #開啟圖例，設定標籤和圖例位置
plt.tight_layout(rect=(1,1,3,3))

plt.show()                                           #顯示圖表

### plt.subplot(nrows, ncols, index)
- 一次僅產生一個子圖
- nrows：子圖產生的row數
- ncols：子圖產生的col數
- index：子圖索引值，從1開始，從左上角到右下角依次增加編號
- 寫法：plt.subplot(1, 1, 1)或plt.subplot(111)
- 語法：https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.subplot.html

In [None]:
plt.figure(figsize = (8, 8)) 

plt.subplot(2, 1, 1)
plt.plot(x, np.sin(x), 'r')

plt.subplot(2, 1, 2)
plt.plot(x, np.cos(x), 'g')

plt.show()

### plt.axes(left, bottom, width, height)
- left：子圖左邊位置，範圍0~1
- bottom：子圖下面位置，範圍0~1
- width：圖的寬度，範圍0~1
- height：圖的高度，範圍0~1
- plt.axes(left, bottom, width, height) (左、下、寬、高)，範圍從左下角的0到右上角的1。
- plt.axes([0.65, 0.65, 0.2, 0.2]) 從軸的寬度65%和圖的高度65%開始繪圖，往右上角繪製寬度20%與高度20%的子圖
- 語法：https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.axes.html

In [None]:
plt.figure(figsize = (8, 8)) 

plt.axes([0.1, 0.1, .8, .8])
plt.text(0.6, 0.6, 'text 1', ha = 'center', va = 'center', size = 20, alpha = .5)

plt.axes([0.2, 0.2, .3, .3])
plt.text(0.5, 0.5, 'text 2', ha = 'center', va = 'center', size = 16, alpha = .5)

plt.show()

## 2. 物件導向方式

直接操控 Matplotlib 底層的 Figure (單一的繪圖容器) 與 Axes 物件 (具有邊界、刻度、與標籤之方框) 物件來繪圖, 使用者對於圖形有完全的操控能力，由於具有靈活性與可客製化優點，通常用於複雜度高的大型程式開發，雖然比 pyplot 要麻煩些, 但使用物件導向方式來繪圖其實主要也只是在呼叫 Figure 與 Axes 物件的各種方法而已。

繪圖前需先建立figure與axes兩個物件。
指定mxn畫布。
plt函數轉換為ax方法：plt.plot() → ax.plot()、plt.legend() →ax.legend()、plt.nn → ax.set_nn\
(1) 建立畫布，或可理解為建立一個繪圖物件：fig = plt.figure()\
(2) 建立繪圖區：ax= fig.subplot(1. 1. 1)，或直接 fig, ax = plt.subplots()\
(3) 在繪圖區上繪圖：ax.plot(x, y)\
(4) 設定圖行屬性：ax.set_xticks()、ax.set_yticks()、ax.set_xticklabels()、ax.set_yticklabels()、ax.set_xlabel()、ax.set_ylabel()、ax.set_xlim()、ax.set_ylim()、ax.legend()、ax.set_title()\
(5) 設定次Y軸與否：ax2 = ax.twinx()\
(6) 存成圖片：fig.savefig('sample.jpg')\
(7) 顯示圖形：fig.show()

### fig, ax = plt.subplots(nrows=1, ncols=1, sharex='col', sharey='row')
- 一次產生 mxn 數量的子圖，並回傳fig、axes
- nrows：子圖產生的row數
- ncols：子圖產生的col數
- 語法：https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.subplots.html

In [None]:
fig, ax = plt.subplots(figsize = (10, 5))
ax.plot(df['date'], df['value'])
plt.show()

In [None]:
fig, ax = plt.subplots(2, 2, figsize = (10, 5))

ax[0,0].plot(x, np.sin(x))
ax[0,1].plot(x, np.cos(x))
ax[1,0].plot(x, x**1.5)
ax[1,1].plot(x, x**2)

plt.show()

### ax = fig.add_subplot()
- 與 plt.subplot() 類似功能子圖設定 
- plt.subplot() 會刪除已存在的子圖
- fig.add_subplot() 會保留子圖及軸
- 位置無法自行決定，兩個區域不會重疊

In [None]:
fig = plt.figure()

ax1 = fig.add_subplot(2, 1, 1)
ax1.plot(x, np.sin(x))

ax2 = fig.add_subplot(2, 1, 2)
ax2.plot(x, np.cos(x))

plt.show()

### ax = fig.add_axes()
位置可自行決定，兩個區域可以重疊

In [None]:
plt.rcParams['axes.unicode_minus'] = False
fig = plt.figure() 

ax1 = fig.add_axes([0.1, 0.5, 0.8, 0.4], xticklabels = [], ylim = (-1.2, 1.2)) 
ax1.plot(np.sin(x)) 

ax2 = fig.add_axes([0.1, 0.1, 0.8, 0.4], ylim = (-1.2, 1.2)) 
ax2.plot(np.cos(x))

plt.show()

---

# 二、Matplotlib 繪圖
## 1. 折線圖
### plt.plot(x, y, fmt, data)
- x：x 軸上的座標。型態為 array-like 或 data 的 column 名稱。
- y：y 軸上的座標。型態為 array-like 或 data 的 column 名稱。
- fmt：[marker][line][color] 格式的字串。。
    - marker：點的樣式。
    - line：線的樣式。
    - color：顏色。
- data：資料。
- 語法：https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.plot.html

## 2. 條形圖
### plt.bar(x, height, width=0.8, bottom=None, \*, align='center', data=None, **kwargs)

In [None]:
plt.bar([0, 1, 2, 3], [78, 67, 90, 81])
plt.xticks([0, 1, 2, 3], labels = ['Jack', 'Mary', 'Mike', 'David'])

## 3. 直方圖
### plt.hist(data, bins=30, density=True, alpha=0.5, histtype='stepfilled', color='steelblue', edgecolor='none')
- arr：一維數組
- bins：直方圖的柱數，可選項，預設為10
- density：是否將得到的直方圖向量歸一化。預設為0
- color：顏色序列，默認為None
- facecolor：直方圖顏色
- edgecolor：直方圖邊框顏色
- alpha：透明度
- histtype：直方圖類型，『bar』, 『barstacked』, 『step』, 『stepfilled』
- 語法：https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.hist.html

In [None]:
kwargs = dict(bins=40, alpha=0.3, density=True, histtype = 'stepfilled') 
plt.hist(x, **kwargs)

## 4. 散點圖
### plt.scatter(x, y, label='skitscat', color='magenta', s=500, marker="o")
- x：x軸資料
- y：Y軸資料
- label：圖例設定
- c或color：標記顏色
- s或sizes：設定 markersize
- marker：標記資形狀
- 用法：https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.scatter.html

In [None]:
plt.scatter(x, y, c = 'magenta', marker="*")

## 5. 圓餅圖
### plt.pie(sizes, explode=explode, labels=labels, autopct='%1.1f%%', shadow=True, startangle=90)
* sizes   :數值,1-D array
* explod  :凸顯
* labels  :圖例
* autopct: 小數點位數呈現
* 語法: https://matplotlib.org/stable/gallery/pie_and_polar_charts/pie_features.html
* seaborn 沒有 pie 圖，所以 pie圖要採用 matplotlib !!

In [None]:
plt.pie(data, labels = label, colors = color, startangle = 90, explode = (0,0,0,0.1), autopct = '%.2f%%')

## 6. 箱型圖

In [None]:
plt.boxplot(tips.tip)

## 補充：註釋與繪製箭頭等形狀
除了圖例之外，有時也會需要繪製一些文字（text）、箭頭（arrow）或註釋（annotate）等，這時就可以使用下面三個方法：
* plt.text()：在子圖的指定座標加上文字
* plt.arrow()：在子圖的指定座標加上箭頭
* plt.annotate()：註釋可以直接劃上文字和箭頭。

In [None]:
plt.text(x, y, 'This is text', family = 'serif', fontsize = 12)

## 補充：繪圖風格
用已經被設計過的風格, 讓觀看者更清楚明瞭，包含色彩選擇、線條、樣式等

In [None]:
plt.style.use('default')    # 不需設定就會使用預設
plt.style.use('ggplot')
plt.style.use('seaborn')    # 或採用 seaborn 套件繪圖 

---

# 三、Seaborn繪圖
* 底層用 Matplotlib 建構，Matplotlib 和 Seaborn 的關係就像 Tenserflow 與 Keras
* 透過封裝的方式大幅度地簡化許多設定上的細節，且也美化的圖表本身的輸出
* 圖像與配色相較 Matplotlib 美觀
* 由於參數的系統化，導致調整不易，自由度較低

In [None]:
sns.set(style = "whitegrid", font = 'Arial Unicode MS')

tips = sns.load_dataset("tips")
tips.head()

## 1. 條形圖: sns.barplot()

In [None]:
ax = sns.barplot(x = 'sex', y = 'total_bill', data = tips, hue = "time")
ax.set_title('吸菸與否帳單-性別')

In [None]:
grid = sns.FacetGrid(data = tips, col = "time")
grid.map(sns.barplot, "sex", "total_bill", order = ['Male','Female'])

In [None]:
sns.countplot(x = "sex", data = tips)

## 2. 直方圖,  核密度估計: sns.histplot(), sns.distplot(), sns.kdeplot()
displot 可以同時呈現直方圖和密度圖，可以更好地去評估分布的組成

In [None]:
fig, ax = plt.subplots(1, 3, figsize=(16, 6))
sns.histplot(tips.total_bill, kde = True, ax = ax[0])
sns.distplot(tips.total_bill, ax = ax[1])
sns.kdeplot(tips.total_bill, shade=True, ax = ax[2])
plt.show()

## 3. 散點圖：sns.regplot(), sns.lmplot(), sns.relplot(), sns.jointplot(), sns.pairplot()
Seaborn 的 regplot 可同時繪製出散佈圖（scatter）和回歸（Regression），可以很快速地評估該資料是否有某種趨勢

In [None]:
sns.regplot(x = "total_bill", y = "tip", data = tips)

In [None]:
sns.lmplot(x = "total_bill", y = "tip", col = 'time', hue  = 'smoker', data = tips)

In [None]:
sns.relplot(x = "total_bill", y = "tip", hue = "smoker", style = "time", data = tips)

In [None]:
sns.jointplot(x = "total_bill", y = "tip", data = tips)

In [None]:
sns.jointplot(x = "total_bill", y = "tip", data = tips, kind = 'reg')   #kind可以選擇scatter、reg、hex、kde、resid

- 六邊形分箱圖(kind = "hex")為散點圖的延伸，隨著數據量越大，數據會重疊在一起，較難看出趨勢集群體。以特定區域為單位，可以統計出這個區域裡散點的頻率，用顏色表示出現頻率高低。
- pairplot 散點圖矩陣：在探索資料時，若能看到不同變數間的散點圖非常有幫助，但如果一個一個繪製不僅容易忘記，也很難直接看到不同變數間的關係。這時 pairplot 就派上用場了
- facetgrid 層面圖與分組：可以使用 facetgrid 來依照多個分類進行視覺化

In [None]:
sns.jointplot(x = "total_bill", y = "tip", data = tips, kind = "hex", color = "k")      #非常適合展示大數據

In [None]:
sns.pairplot(tips, kind = 'scatter', diag_kind = "hist", hue = "time", palette = "husl")

In [None]:
grid = sns.PairGrid(data = tips, hue = 'time', palette = "husl", diag_sharey = False)
grid.map_upper(sns.scatterplot)
grid.map_diag(sns.kdeplot, lw = 2)
grid.map_lower(sns.kdeplot)

In [None]:
grid = sns.FacetGrid(data = tips, col = "time")
grid.map(sns.scatterplot, "total_bill", "tip")

## 4. 箱型圖: sns.boxplot(), sns.violinplot()
與箱型圖區別在於，小提琴圖是使用核密度圖  (描繪不同值的數據的機率密度) 可視化分組數值數據的另一種有效方法，也就是不是用真實資料點繪製。白點是中位數，小提琴內的黑色條是四分位數範圍(IQR)，延伸的黑線是Q1-1.5*IQR 和 Q3+1.5*IQR。小提琴情節的較寬部分表示高概率，較窄的部分表示低概率。

In [None]:
sns.boxplot(x = 'time', y = 'tip', data = tips)

In [None]:
sns.violinplot(x = "time", y = 'tip', data = tips)

In [None]:
sns.stripplot(x = "time", y = "tip", data = tips, jitter = False)

In [None]:
sns.swarmplot(x = "time", y = "tip", data = tips)     #適合小型數據集

In [None]:
sns.catplot(x = "time", y = "tip", data = tips, kind = "swarm")

## 5. 熱力圖: sns.heatmap()

In [None]:
flights = sns.load_dataset("flights")   # 載入航班數據
flights = flights.pivot("month", "year", "passengers")  #修改數據排列
sns.heatmap(flights, linewidths=1 , cmap="YlGnBu", cbar=False) # 劃分每格單元的行寬度，使用不同的colormap，取消顏色條

---

# 四、Dataframe 繪圖
## 1. 折線圖 (呈現趨勢變化)

In [None]:
df.plot()

## 2. 條形圖 (用在數值的顯示或者比較)

In [None]:
df.plot.bar(stacked = True)

## 3. 直方圖 (分佈)

In [None]:
df.hist(column = 'tip', bins = 20)

## 4. 箱型圖 (分佈)

In [None]:
df.boxplot(column = 'tip', by = 'time')

## 5. 散點圖 (呈現相關數值間的關係)

In [None]:
df.plot.scatter(x = 'col1', y = 'col2')

## 6. 圓餅圖 (呈現不同種類資料，在整體資料所佔比例)

In [None]:
df.plot.pie()

---

# 五、Plotly 繪圖
plotly套件安裝: pip install plotly。安裝完可能需要更新numpy: pip install numpy --upgrade

In [None]:
import plotly.graph_objects as go
import plotly.express as px
from plotly.subplots import make_subplots

In [None]:
fig = px.choropleth(df3, locations = df3['Country/Region'],
                    color = df3['Confirmed'], locationmode = 'country names', 
                    hover_name = df3['Country/Region'], 
                    color_continuous_scale = px.colors.sequential.Tealgrn,
                    template = 'plotly_dark')
fig.update_layout(
    title = 'Confirmed Cases In Each Country',
)
fig.show()

In [None]:
fig = px.choropleth(df1, locations = df1['Country/Region'],
                    color = df1['Confirmed'], locationmode = 'country names', 
                    hover_name = df1['Country/Region'], 
                    color_continuous_scale = px.colors.sequential.deep,
                    template = 'plotly_dark', 
                    animation_frame = "ObservationDate")
fig.update_layout(
    title = 'Evolution of confirmed cases In Each Country',
)
fig.show()

In [None]:
from wordcloud import WordCloud
wordcloud = WordCloud(width = 600, height = 400).generate(text)
wordcloud.to_image()