# Chapter 9 繪圖與視覺化

## Plotting and Visualization Part I

In [1]:
%matplotlib notebook

In [2]:
import matplotlib.pyplot as plt

In [3]:
import numpy as np
import pandas as pd

In [4]:
data=np.arange(10)

In [5]:
data

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [6]:
plt.plot(data) ### 畫出一條線。

<IPython.core.display.Javascript object>

[<matplotlib.lines.Line2D at 0x7fc9ce034550>]

### matplotlib的圖儲存在figure內。

In [7]:
fig=plt.figure()

<IPython.core.display.Javascript object>

### fig.add_subplot(x,y,n): 在fig的檔案內建立小圖，x,y表示橫向與垂直有幾張圖，n則表示小圖的編碼。

In [8]:
ax1=fig.add_subplot(2,2,1) ### 總共有2*2=4張圖，此為編碼1號的圖，位於左上角。

In [9]:
ax2=fig.add_subplot(2,2,2)

In [10]:
ax3=fig.add_subplot(2,2,3)

### 提醒：同一張的圖的程式盡量放在同一個cell內，才不會執行完cell後，被重置繪圖。

In [11]:
fig=plt.figure()
ax1=fig.add_subplot(2,2,1)
ax2=fig.add_subplot(2,2,2)
ax3=fig.add_subplot(2,2,3)

<IPython.core.display.Javascript object>

### 在執行一個繪圖命令時，matplotlib會在最近一個被使用的圖中。

In [12]:
plt.plot([1.5,3.5,-2,1.6])

[<matplotlib.lines.Line2D at 0x7fc9ce0fa7c0>]

### 'k--' 表示畫出黑色的虛線。

In [13]:
plt.plot(np.random.randn(50).cumsum(), 'k--')

[<matplotlib.lines.Line2D at 0x7fc9ce0fac10>]

### ax1.hist(): 在第一張圖畫上直方圖。

In [14]:
_=ax1.hist(np.random.randn(100),bins=20,color='k',alpha=0.3)

### ax2.scatter(): 在第二張圖畫上散布圖。

In [15]:
ax2.scatter(np.arange(30), np.arange(30)+3 * np.random.randn(30))

<matplotlib.collections.PathCollection at 0x7fc9ce2e4a00>

### plt.subplots(index, columns) 可以很快速的建立多個圖。

In [16]:
fig, axes=plt.subplots(2,3)

<IPython.core.display.Javascript object>

In [17]:
axes

array([[<AxesSubplot:>, <AxesSubplot:>, <AxesSubplot:>],
       [<AxesSubplot:>, <AxesSubplot:>, <AxesSubplot:>]], dtype=object)

### 讓子圖間留白

### subplots_adjust(left=None, bottom=None, right=None, top=None, wspace=None, hspace=None)

### sharex=True, sharey=Ture 所有的子圖都用一樣的x軸與y軸比例。

In [18]:
fig,axes=plt.subplots(2,2, sharex=True, sharey=True)

<IPython.core.display.Javascript object>

### axes[i,j]:子圖的位置可以用二維陣列表示。
### plt.subplots_adjust(wsapce=0, hspace=0) 因為調整長寬間距都是0，所以4張圖直接黏在一起。

In [19]:
for i in range(2):
    for j in range(2):
        axes[i,j].hist(np.random.randn(500), bins=50, color='k', alpha=0.5)
plt.subplots_adjust(wspace=0, hspace=0)

### 色彩、標示和線條樣式

### 畫一條綠色的虛線：ax.plot(x,y,'g--') 或是 ax.plot(x,y, linestyle='--', color='g')

In [20]:
fig,axes=plt.subplots(1,1, sharex=True, sharey=True)

<IPython.core.display.Javascript object>

In [21]:
from numpy.random import randn

In [22]:
plt.plot(randn(30).cumsum(),'ko--')

[<matplotlib.lines.Line2D at 0x7fc9ce56b490>]

In [23]:
fig,axes=plt.subplots(1,1, sharex=True, sharey=True)

<IPython.core.display.Javascript object>

### randn(30)：有30個值。cumsun(): a, a+b, a+b+c..
### color='k' 顏色是黑色
### linestyle='dashed' 線條是虛線。
### marker='0' 標記符號是圓點。

In [24]:
plt.plot(randn(30).cumsum(), color='k', linestyle='dashed', marker='o')

[<matplotlib.lines.Line2D at 0x7fc9ce5a5be0>]

In [25]:
fig,axes=plt.subplots(1,1, sharex=True, sharey=True)

<IPython.core.display.Javascript object>

In [26]:
data=np.random.randn(30).cumsum()

### 此處的label='Default'的功能在於幫圖例設定名稱。

In [27]:
plt.plot(data, 'k--', label='Default')

[<matplotlib.lines.Line2D at 0x7fc9ce5a5a90>]

In [28]:
plt.plot(data, 'k-', drawstyle='steps-post',label='steps-post')

[<matplotlib.lines.Line2D at 0x7fc9ce60a940>]

In [29]:
plt.legend(loc='best')

<matplotlib.legend.Legend at 0x7fc9ce60f190>

### 刻度、標籤和圖例

### 設定主題、軸標籤、刻度和刻度標籤

In [30]:
fig=plt.figure()

<IPython.core.display.Javascript object>

In [31]:
ax=fig.add_subplot(1,1,1)

In [32]:
ax.plot(np.random.randn(1000).cumsum())

[<matplotlib.lines.Line2D at 0x7fc9ce661370>]

### 設定x軸的刻度：set_xticks, set_xticklabels

### set.xticks([list]): 設定x軸的間距。
### set.xticklabels([list]): 設定x軸的間距的名稱。
### rotation: 設定x軸間距名稱要旋轉幾度。
### fontsize: 字體大小
### set_title: 設定圖的標題。
### set_xlabel: 設定ｘ軸的標題。

In [33]:
ticks=ax.set_xticks([0,250,500,750,1000])

In [34]:
labels=ax.set_xticklabels(['one','two','three','four','five'], rotation=30, fontsize='small')

In [35]:
ax.set_title('My first matplotlib plot')

Text(0.5, 1.0, 'My first matplotlib plot')

In [36]:
ax.set_xlabel('Stages')

Text(0.5, 0, 'Stages')

## 上述的寫法，也可以統一寫成dict，再放入ax.set(**dict)，一樣可以產生標題。

In [37]:
props={'title': 'My first matplotlib plot', 'xlabel':'Stages'}
ax.set(**props)

[Text(0.5, 1.0, 'My first matplotlib plot'), Text(0.5, 0, 'Stages')]

## 加入圖例

In [38]:
from numpy.random import randn

In [39]:
fig=plt.figure();ax=fig.add_subplot(1,1,1)

<IPython.core.display.Javascript object>

### label='one' 我們可以將不同的折線圖設定名稱，該名稱會隨著ax.legend()出現在圖例上。

In [40]:
ax.plot(randn(1000).cumsum(),'k', label='one')

[<matplotlib.lines.Line2D at 0x7fc9ce6b6400>]

In [41]:
ax.plot(randn(1000).cumsum(),'k--',label='two')

[<matplotlib.lines.Line2D at 0x7fc9ce6b6490>]

In [42]:
ax.plot(randn(1000).cumsum(),'k.',label='three')

[<matplotlib.lines.Line2D at 0x7fc9ce6b62b0>]

### loc的位置有 'best', 'upper right', 'upper left', 'lower left', 'lower right', 'right', 'center left', 'center right', 'lower center', 'upper center', 'center'

In [43]:
ax.legend(loc='best')

<matplotlib.legend.Legend at 0x7fc9ce6b6610>

### 如果不希望該圖顯示在圖例上，就不要寫上label或是label='_nolegend_'

In [44]:
ax.plot(randn(1000).cumsum(),'g--',label='_nolegend_')

[<matplotlib.lines.Line2D at 0x7fc9ce6b6a30>]

In [45]:
ax.legend(loc='best')

<matplotlib.legend.Legend at 0x7fc9ce6c6880>

### 註釋與畫圖形

In [46]:
from datetime import datetime

In [47]:
fig=plt.figure()

<IPython.core.display.Javascript object>

In [48]:
ax=fig.add_subplot(1,1,1)

### index_col=0 指定csv檔案的第一個欄位為index。
### parse_dates=True 同意系統嘗試判斷csv內的日期。

In [49]:
data=pd.read_csv('examples/spx.csv', index_col=0, parse_dates=True)

In [50]:
spx=data['SPX']

In [51]:
spx.head()

Date
1990-02-01    328.79
1990-02-02    330.92
1990-02-05    331.85
1990-02-06    329.66
1990-02-07    333.75
Name: SPX, dtype: float64

In [52]:
spx.plot(ax=ax, style='k-')

<AxesSubplot:xlabel='Date'>

### 上式也可寫為 ax.plot(spx,'k-')

### 給予另一份資料，記載三次發生金融危機的時間點。

In [53]:
crisis_data=[(datetime(2007,10,11), 'Peak of bull market'),
             (datetime(2008,3,12),'Bear Stearns Fails'),
             (datetime(2008,9,15), 'Lehman Bankruptcy')]

### ax.annotate(label, xy, xytext, arrowprops) 可以用來設定圖表的註釋。
### label 代表註釋的文字內容
### xy 代表被註釋的座標點
### xytest 代表註釋文字的座標點
### arrowprops 代表箭頭的樣式

### asof(date) 可用來尋找日期，如果找不到，會取最近一次的日期。

### headwidth, headlength 箭頭頭部的長寬。width 箭頭本身粗細。 
### horizontalalignment, verticalalignment 文字對齊的位置。

In [54]:
for date, label in crisis_data:
    ax.annotate(label, xy=(date, spx.asof(date)+75),
               xytext=(date, spx.asof(date)+225),
               arrowprops=dict(facecolor='black',headwidth=4, width=2, headlength=4),
               horizontalalignment='left', verticalalignment='top')

### xlim(min,max), ylim(min, max) 可以設定x軸與y軸的最大值與最小值。

In [55]:
ax.set_xlim(['1/1/2007','1/1/2011'])
ax.set_ylim([600,1800])

(600.0, 1800.0)

### set_titile 幫這張圖命名。

In [56]:
ax.set_title('Important dates in the 2008-2009 financial crisis')

Text(0.5, 1.0, 'Important dates in the 2008-2009 financial crisis')

### 在圖上畫形狀:  ax.add_patch(shp)

In [57]:
fig=plt.figure()

<IPython.core.display.Javascript object>

In [58]:
ax=fig.add_subplot(1,1,1)

### Rectangle(xy, width, height, angle=0.0, fill=True, **kwargs)
### xy 是一個長度為 2 的元組，用於指定要繪製的矩形的左下角的座標。
### width 是矩形的寬度。
### height 是矩形的高度。
### angle 是逆時針角度，以度為單位。
### fill 指定矩形是否用 facecolor 填充。
### kwargs: edgecolor：矩形邊緣的顏色 ; facecolor：矩形的填充色

In [59]:
rect=plt.Rectangle((0.2,0.75), 0.4,0.15, color='k', alpha=0.3)

### Circle((x, y), r=5, **kwargs)
### (x,y): 圓心的座標
### r=5 半徑，預設值為5

In [60]:
circ=plt.Circle((0.7,0.2),0.15, color='b', alpha=0.3)

### Polygon(xy, *, closed=True, **kwargs)
### xy的形式為[[x1,y1],[x2,y2],[x3,y3]] 代表多邊形每一個角的座標，會逆時針的連起來。
### close=True 代表所有線會連起來，開頭與結尾的點一樣。

In [61]:
pgon=plt.Polygon([[0.15,0.15],[0.35,0.4],[0.2,0.6]],color='g',alpha=0.5) 

In [62]:
ax.add_patch(rect)

<matplotlib.patches.Rectangle at 0x7fc9cef7db50>

In [63]:
ax.add_patch(circ)

<matplotlib.patches.Circle at 0x7fc9cef42b20>

In [64]:
ax.add_patch(pgon)

<matplotlib.patches.Polygon at 0x7fc9cef8b7f0>

### plt.savefig 把圖存檔

### 可以依據想要的格式儲存檔案，例如：.svg, .pdf, .png, .ps, .eps

In [65]:
plt.savefig('figpath.svg')

### dpi:每英吋的解析度，預設值是100。
### bbox_inches: 圖的哪一個部分要存檔，如果是tight，會試著將圖周圍的空白除掉。

In [66]:
plt.savefig('figpath.png',dpi=400,bbox_inches='tight')

### BytesIO 可以寫到任何檔案的物件中。

In [67]:
from io import BytesIO
buffer=BytesIO()
plt.savefig(buffer)
plot_data=buffer.getvalue()

### Matplotlib 設定

### plt.rc(figsize(x, y))變更圖型大小

In [68]:
figure=plt.figure()

<IPython.core.display.Javascript object>

In [69]:
ax=figure.add_subplot(1,1,1)

In [70]:
circ=plt.Circle((0.5,0.5),0.2, color='r', alpha=0.4)

In [71]:
ax.add_patch(circ)

<matplotlib.patches.Circle at 0x7fc9ce9b1ca0>

In [72]:
plt.rc('figure',figsize=(10,10))

In [73]:
font_options={'family':'monospace', 
              'weight':'bold',
              'size':0.5}

In [74]:
plt.rc('font',**font_options)