# Matplotlibライブラリ
Matplotlibライブラリについて説明します。

参考

- https://matplotlib.org/

**Matplotlib**ライブラリにはグラフを可視化するためのモジュールが含まれています。  
以下では、Matplotlibライブラリのモジュールを使った、グラフの基本的な描画について説明します。

Matoplotlibライブラリを使用するには、まず `matplotlib` のモジュールをインポートします。ここでは、基本的なグラフを描画するための `matplotlib.pyplot` モジュールをインポートします。慣例として、同モジュールを `plt` と別名をつけてコードの中で使用します。  
また、グラフで可視化するデータはリストや配列を用いることが多いため、 `numpy` モジュールも併せてインポートします。

In [None]:
import numpy as np
import matplotlib.pyplot as plt

よくある例として、`%matplotlib inline` を使用する事があります。  
`matplotlib` では、通常 `show()` 関数を呼ぶと描画を行いますが、`inline` 表示指定の場合、`show()` 関数を省略できます。  
  
本講座では自動的に描画を行うことはなく、適切なタイミングで`show()` 関数を使用する為に`%matplotlib inline` は使用しません。

## 線グラフ

`pyplot` モジュールの **`plot()`** 関数を用いて、リストの要素の数値をy軸の値として**グラフ**を描画します。  
y軸の値に対応するx軸の値は、リストの各要素のインデックスとなっています。

具体的には、次のようにすることで `リストA` のインデックス `i` に対して、`(i, リストA[i])` の位置に点を打ち、各点を線でつなぎます。

---
```Python
plt.plot(リストA)
```
---

たとえば、次のようになります。

In [None]:
# plotするデータ
d = [0, 1, 4, 9, 16]

# plot関数で描画
plt.plot(d);

plt.show()
# セルの最後に評価されたオブジェクトの出力表示を抑制するために、以下ではセルの最後の行にセミコロン (`;`) をつけています。
# 試しにセミコロンを消した場合も試してみてください。

`plot()` 関数では、x, y の両方の軸の値を引数に渡すこともできます。

具体的には、次のように `リストX` と `リストY` を引数として与えると、各 `i` に対して、 `(リストX[i], リストY[i])` の位置に点を打ち、各点を線でつなぎます。

---
```Python
plt.plot(リストX, リストY)
```
---


In [None]:
# plotするデータ
x = [0, 1, 2, 3, 4]
y = [0, 3, 6, 9, 12]

# plot関数で描画
plt.plot(x, y);

plt.show()

リストの代わりに**NumPy**ライブラリの配列を与えても同じ結果が得られます。

In [None]:
# plotするデータ
x = np.array([0, 1, 2, 3, 4])
y = np.array([0, 3, 6, 9, 12])

# plot関数で描画
plt.plot(x, y); 

plt.show()

以下のようにグラフを複数まとめて表示することもできます。複数のグラフを表示すると、線ごとに異なる色が自動で割り当てられます。

In [None]:
# plotするデータ
data = [0, 1, 4, 9, 16]
x = [0, 1, 2, 3, 4]
y = [0, 1, 2, 3, 4]

# plot関数で描画
plt.plot(x, y)
plt.plot(data);

plt.show()

`plot()` 関数ではグラフの線の色、形状、データポイントのマーカの種類を、それぞれ以下のように `linestyle`, `color`, `marker` 引数で指定して変更することができます。  
それぞれの引数で指定可能な値は以下を参照してください。

- [linestyle](https://matplotlib.org/stable/gallery/lines_bars_and_markers/linestyles.html)
- [color](https://matplotlib.org/stable/gallery/color/index.html)
- [marker](https://matplotlib.org/stable/gallery/lines_bars_and_markers/marker_reference.html)

In [None]:
# plotするデータ
data =[0, 1, 4, 9, 16]
x =[0, 1, 2, 3, 4]
y =[0, 1, 2, 3, 4]

# plot関数で描画。線の形状、色、データポイントのマーカ指定
plt.plot(x,y, linestyle='--', color='blue', marker='o') 
plt.plot(data, linestyle=':', color='green', marker='*');

plt.show()

`plot()` 関数の `label` 引数にグラフの各線の凡例を文字列として渡し、**`legend()`** 関数を呼ぶことで、グラフ内に凡例を表示できます。  
`legend()` 関数の `loc` 引数で凡例を表示する位置を指定することができます。  
引数で指定可能な値は以下を参照してください。

- [lengend()](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.legend.html)

In [None]:
# plotするデータ
data =[0, 1, 4, 9, 16]
x = [0, 1, 2, 3, 4]
y = [0, 1, 2, 3, 4]

# plot関数で描画。線の形状、色、データポイントのマーカ指定
plt.plot(x,y, linestyle='--', color='blue', marker='o', label='linear') 
plt.plot(data, linestyle=':', color='green', marker='*', label='quad')

#凡例を表示
plt.legend();

plt.show()

`pyplot` モジュールでは、以下のようにグラフのタイトルと各軸のラベルを指定して表示することができます。  
タイトル、x軸のラベル、y軸のラベル、はそれぞれ **`title()`** 関数、**`xlabel()`** 関数、**`ylabel()`** 関数に文字列を渡して指定します。  
また、**`grid()`** 関数を用いるとグリッドを併せて表示することもできます。グリッドを表示させたい場合は、`grid()` 関数に `True` を渡してください。

In [None]:
# plotするデータ
data = [0, 1, 4, 9, 16]
x = [0, 1, 2, 3, 4]
y = [0, 1, 2, 3, 4]

# plot関数で描画。線の形状、色、データポイントのマーカ、凡例を指定
plt.plot(x,y, linestyle='--', color='blue', marker='o', label='linear') 
plt.plot(data, linestyle=':', color='green', marker='*', label='quad')
plt.legend()

# グラフのタイトル
plt.title('My First Graph') 

#　x, y軸のラベル
plt.xlabel('x') 
plt.ylabel('y')

# グリッドの表示
plt.grid(True);

plt.show()

グラフを描画するときのプロット数を増やすことで任意の曲線のグラフを作成することもできます。  
以下では、`numpy` モジュールの `arange()` 関数を用いて、$- \pi$ から $\pi$ の範囲を `0.1` 刻みでx軸の値を配列として準備しています。  
そのx軸の値に対して、`numpy` モジュールの `cos()` 関数と `sin()` 関数を用いて、y軸の値をそれぞれ準備し、cosカーブとsinカーブを描画しています。

In [None]:
#　グラフのx軸の値となる配列
x = np.arange(-np.pi, np.pi, 0.1)

# 上記配列をcos, sin関数に渡し, y軸の値として描画
plt.plot(x, np.cos(x))
plt.plot(x, np.sin(x))

# グラフのタイトル
plt.title('cos ans sin Curves')  

#　x, y軸のラベル
plt.xlabel('x')
plt.ylabel('y')

# グリッドの表示
plt.grid(True); 

plt.show()

プロットの数を少なくすると、曲線は直線をつなぎ合わせることで描画されていることがわかります。

In [None]:
x = np.arange(-np.pi, np.pi, 0.5)
plt.plot(x,np.cos(x), marker='o')
plt.plot(x,np.sin(x), marker='o')

plt.title('cos ans sin Curves')
plt.xlabel('x')
plt.ylabel('y')

plt.grid(True);

plt.show()

### 練習問題1

`-2` から `2` の範囲を `0.1` 刻みでx軸の値を配列として作成し、そのx軸の値に対して `numpy` モジュールの `exp()` 関数を用いてy軸の値を作成し、$y=e^{x}$ のグラフを描画する関数 `plot_exp` を作成してください。  
グラフのタイトル、x軸、y軸のラベル、凡例、グリッド等については、以下に示す完成予想図を参考にしてください。
  
![1-1.png](attachment:6485649a-0677-4a7a-b29d-d7dc3eca7000.png)

In [None]:
def plot_exp():
    ...

### 練習問題2

`tokyo-temps.csv` には、気象庁のオープンデータからダウンロードした、東京の平均気温のデータが入っています。具体的には、各行の第2列に気温の値が格納されており、47行目に1875年6月の、48行目に1875年7月の、…、53行目に1875年12月の、54行目に1876年1月の、…という風に2017年1月のデータまでが格納されています。

そこで、2つの整数 `year` と `month` を引数として取り、 `year` 年以降の `month` 月の平均気温の値をy軸に、年をx軸に描画した線グラフを描画する関数 `plot_tokyotemps` を作成してください。   
グラフのタイトル、x軸、y軸のラベル、凡例、グリッド等については、以下に示す完成予想図を参考にしてください。
  
![1-2.png](attachment:83afce02-430a-48ab-a825-fa9d06ad4136.png)

In [None]:
def plot_tokyotemps(year, month):
    ...

## 散布図
**散布図**は、`pyplot` モジュールの **`scatter()`** 関数を用いて描画できます。  
https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.scatter.html

具体的には、次のように `リストX` と `リストY` （もしくは、 `配列X` と `配列Y`）を引数として与えると、各 `i` に対して、 `(リストX[i], リストY[i])` の位置に点を打ちます。

---
```Python
plt.scatter(リストX, リストY)
```
---

以下では、ランダムに生成した20個の要素からなる配列 x, y の各要素の値の組を点としてプロットした散布図を表示しています。プロットする点のマーカの色や形状は、線グラフの時と同様に、 `color`, `marker` 引数で指定して変更することができます。加えて、`s`, `alpha` 引数で、それぞれマーカの大きさと透明度を指定することができます。

In [None]:
#　グラフのx軸の値となる配列
x = np.random.rand(20)

#　グラフのy軸の値となる配列
y = np.random.rand(20)

# scatter関数で散布図を描画
plt.scatter(x, y, s=100, alpha=0.5);

以下のように、`plot()` 関数を用いても同様の散布図を表示することができます。具体的には、3番目の引数にプロットする点のマーカの形状を指定することにより実現します。

In [None]:
x = np.random.rand(20)
y = np.random.rand(20)
plt.plot(x, y, '*', color='blue');

### 練習問題3

`tokyo-temps.csv` には、気象庁のオープンデータからダウンロードした、東京の平均気温のデータが入っています。具体的には、各行の第2列に気温の値が格納されており、47行目に1875年6月の、48行目に1875年7月の、…、53行目に1875年12月の、54行目に1876年1月の、…という風に2017年1月のデータまでが格納されています。

そこで、1875年以降の平均気温の値をy軸に、月の値をx軸に描画した散布図を表示するとともに、描画したx軸とy軸の値をタプルに格納して返す関数 `scatter_tokyotemps` を作成してください。  
グラフのタイトル、x軸、y軸のラベル、凡例、グリッド等については、以下に示す完成予想図を参考にしてください。
  
![1-3.png](attachment:64816f89-e188-4783-9962-099a5fecf22d.png)

In [None]:
def scatter_tokyotemps():
    ...

## 棒グラフ
**棒グラフ**は、`pyplot` モジュールの **`bar()`** 関数を用いて描画できます。  
https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.bar.html

以下では、ランダムに生成した10個の要素からなる配列 `y` の各要素の値を縦の棒グラフで表示しています。  
`x` は、x軸上で棒グラフのバーの並ぶ位置を示しています。ここでは、`numpy` モジュールの `arange()` 関数を用いて、`1` から `10` の範囲を `1` 刻みでx軸上のバーの並ぶ位置として配列を準備しています。

In [None]:
# x軸上で棒の並ぶ位置となる配列
x = np.arange(1, 11, 1)

#　グラフのy軸の値となる配列
y = np.random.rand(10)

# bar関数で棒グラフを描画
plt.bar(x, y);

### 練習問題4

`tokyo-temps.csv` には、気象庁のオープンデータからダウンロードした、東京の平均気温のデータが入っています。具体的には、各行の第2列に気温の値が格納されており、47行目に1875年6月の、48行目に1875年7月の、…、53行目に1875年12月の、54行目に1876年1月の、…という風に2017年1月のデータまでが格納されています。

そこで、2つの引数 `s_ym`, `n_month` を引数に取り、 `s_ym`（yyyymmの文字列）の年月から その月を含む`n_month` （整数）ヶ月分までの各月の平均気温の値をy軸に、年月の値をx軸に描画した棒グラフを表示する関数 `bar_tokyotemps` を作成してください。  
グラフのタイトル、x軸、y軸のラベル、凡例、グリッド等については、以下に示す完成予想図を参考にしてください。  

![1-4.png](attachment:55b95dcb-0ddb-4b32-8595-fe08c2f6036e.png)

In [None]:
def bar_tokyotemps(s_ym, n_month):
    ...

## ヒストグラム

**ヒストグラム**は、`pyplot` モジュールの **`hist()`** 関数を用いて描画できます。  
https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.hist.html


以下では、`numpy` モジュールの `random.randn()` 関数を用いて、正規分布に基づく1000個の数値の要素からなる配列を用意し、ヒストグラムとして表示しています。
`hist()` 関数の `bins` 引数でヒストグラムの箱（ビン）の数を指定します。

In [None]:
# 正規分布に基づく1000個の数値の要素からなる配列 
d = np.random.randn(1000)

# hist関数でヒストグラムを描画
plt.hist(d, bins=20);

### 練習問題5

`tokyo-temps.csv` には、気象庁のオープンデータからダウンロードした、東京の平均気温のデータが入っています。具体的には、各行の第2列に気温の値が格納されており、47行目に1875年6月の、48行目に1875年7月の、…、53行目に1875年12月の、54行目に1876年1月の、…という風に2017年1月のデータまでが格納されています。

そこで、3つの引数 `s_ym`, `n_year`, `bins` を引数に取り、 `s_ym`（yyyymmの文字列）の年月から その月を含む`n_year` （整数）年分までの各月の平均気温の値から `bins` 個のヒストグラムを表示する関数 `hist_tokyotemps` を作成してください。  
グラフのタイトル、x軸、y軸のラベル、凡例、グリッド等については、以下に示す完成予想図を参考にしてください。（図は s_ym='200201', n_year=4, bins=15の場合）  

![1-5.png](attachment:f5d736f3-d36f-41a5-baa5-8709f9247122.png)

In [None]:

def hist_tokyotemps(s_ym, n_year, bins):
    ...

## グラフの画像ファイル出力
**`savefig()`** 関数を用いると、以下のように作成したグラフを画像としてファイルに保存することができます。

In [None]:
x = np.arange(-np.pi, np.pi, 0.1)
plt.plot(x,np.cos(x), label='cos')
plt.plot(x,np.sin(x), label='sin')
plt.legend()
plt.title('cos ans sin Curves')  
plt.xlabel('x') 
plt.ylabel('y') 
plt.grid(True)

# savefig関数でグラフを画像保存
plt.savefig('cos_sin.png'); 