# Pythonを使用したグラフ作成入門

ここでは，グラフ描画ライブラリmatplotlibを使ったグラフ作成の基礎について学んでいきます．  
このホームページは[Colaboratory](https://colab.research.google.com/notebooks/intro.ipynb?hl=ja)と呼ばれるGoogleが提供するサービスで，  
Googleが提供するサーバを使って自由にPythonプログラムを記述・実行することができます．  
Webブラウザさえあればいいため，環境構築の手間がなく，  
PCのスペックが低くてもネット環境さえあれば本格的なPythonプログラムを作成して実行することができます．

## 必要なライブラリのインポート
ここでは，matplotlibとnumpyの二つのライブラリを使うために，
以下のようなコードを書いてimportを行います．  
matplotlib.pyplotはグラフ描写用のライブラリであり．
numpyは数値計算に便利な機能が集まったライブラリです．  
このように書くと，matplotlib.pyplotをpltとして，numpyをnpとして利用することができるようになります．

__プログラムが書いてある灰色の箱（セル）をクリックして選択し，SHIFTキーを押しながらENTERキーを押してください．__

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# plt.plot()による折れ線グラフの描写

グラフとしてプロットするデータを作ります．  
仮に [1.8, 0.4, 0.9, 2.2, 1.8, -0.9, 0.9, -0.2, -0.1, 0.4] という10個のデータが得られたとします．  
まずは，``np.array()``メソッドを使ってpythonで扱いやすい数の集まり（配列）にまとめ，
dataという変数に代入しましょう．  

__( ソースコードの中で，#記号より右に書いてあるのはプログラムではなく，分かりやすくするためのメモ書きです )__

In [None]:
data = np.array([1.8, 0.4, 0.9, 2.2, 1.8, -0.9, 0.9, -0.2, -0.1, 0.4])  #10個を配列にして,dataと名付けた変数に代入
print(data)                 #dataを画面にプリント

このようにランダムな値が10個入ったデータを作りました．
今後はこの値を仮想的な実験データだとして，そのグラフを作っていきます．

では，``data``に入った10個の数値をグラフにプロットしてみましょう．  
``plt.plot()``メソッド(関数)を以下のように使い，その後に``plt.show()``メソッドを実行すると表示されます．

In [None]:
plt.plot(data)  #dataの値をグラフにプロット
plt.show()      #グラフを画面に表示する

Pythonでmatplotlibを使うとこのように簡単にグラフを描写できました．  
``plt.plot(データ)``とすることで，簡単にグラフを書くことができますが，  

## Axesオブジェクトを使ったグラフの描写
これ以降は次のような作法に従ってグラフを描写していきましょう．

In [None]:
fig = plt.figure() #Figureオブジェクトを生成
ax = fig.add_subplot(111) #Figreオブジェクトの中にAxesオブジェクトを生成
ax.plot(data) #Axesオブジェクトのplotメソッドを使ってグラフを描写．
plt.show()

figは図の大枠，axは図の中の一つのグラフと考えれば大丈夫です．  
今は細かいことを考える必要はありませんので  
``fig = plt.figure()``で図の枠を作り，  
`ax = fig.add_subplot(111)`でグラフの枠をつくり．  
``ax.plot(データ)``でグラフにデータをプロットすると考えれば大丈夫です．

## dots per inch (dpi) を指定して高画質に
``fig = plt.figure(dpi=200)``のようにしてfigを作成する時に引数に
dpiの値を指定するとそれに合わせた画質のグラフを作ることができます．

In [None]:
fig = plt.figure(dpi=200)#dpi値を指定する
ax = fig.add_subplot(111)
ax.plot(data)
plt.show()

## マーカーを指定する
``ax.plot(データ)``でグラフを描写する際に，  
``ax.plot(データ, marker='o')``のようにマーカーを指定することができます．
下の例では``'o'``を使っていますが，他にも````や````など様々なバリエーションがあります(実際に書き換えてみましょう)．  
マーカーのバリエーションは[公式ページ](https://matplotlib.org/stable/api/markers_api.html)にまとめてあるので色々と試してみてください．

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.plot(data, marker='o')#マーカーを指定する
plt.show()

## グリッド線を引く
以下のようにax.grid()メソッドを使うとグラフにグリッド線を引くことができます．

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.plot(data, marker='o')
ax.grid()  #グラフにグリッド線を描く
plt.show()

## タイトル・x軸/y軸を書く
``ax.set_title(タイトル文字列)``でタイトルを書き込むことができます．  
また，
``ax.set_xlabel(x軸名文字列)``でx軸を，
``ax.set_ylabel(y軸名文字列)``でy軸を書くことができます

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.plot(data, marker='o')
ax.set_title('random data') #グラフタイトルを書く
ax.set_xlabel('x axis')     #x軸の名前を書く
ax.set_ylabel('y axis')     #y軸の名前を書く
plt.show()

## 日本語に対応させる
実はmatplotlibはデフォルトでは日本語に対応していないので，  
グラフに日本語のタイトルをつけることができません．  
しかし，japanize-matplotlibというライブラリをインストールして導入すればなんとかなります．  
ここでは呪文だと思って以下のコードを実行しておきましょう．

In [None]:
!pip install japanize-matplotlib #japanize-matplotlibをインストール(Googleのサーバーに)
import japanize_matplotlib #japanize-matplotlibをこのプログラムにimportする

## これでmatplotlibに日本語を使うことができるようになります．

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.plot(data, marker='o')
ax.set_title('ランダムデータ')
ax.set_xlabel('x軸')
ax.set_ylabel('y軸')
plt.show()

## タイトルや軸のフォントを大きくする．
``ax.set_title()``などのグラフにテキストを盛り込むメソッドにおいて,  
fontsize引数を指定することで，以下のように文字フォントの大きさを変えることができます．

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.plot(data, marker='o')
ax.set_title('random data', fontsize=30) #fontsizeを30に指定
ax.set_xlabel('x axis', fontsize=20) #fontsizeを20に指定
ax.set_ylabel('y axis', fontsize=20) #fontsizeを20に指定
plt.show()

## ここからは複数のデータをプロットしていきましょう．
以下のように三つのランダムデータ(data1, data2, data3)を用意します．  
``np.random.randn(10)``のように書くと  
正規分布に従った乱数(ランダムな値)を10個生成することができます．  
``np.random.seed(0)``は乱数シードの固定です．細かいことはここでは省きますが，  
これにより何度実行しても同じ乱数値を生成することができます．

In [None]:
np.random.seed(0)
data1 = np.random.randn(10)+5.0
data2 = np.random.randn(10)+3.0
data3 = np.random.randn(10)+2.0

## 複数のデータをプロット
プロットしたいデータが複数のときは，以下のように``ax.plot(データ)``を連続して実行すれば大丈夫です．

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.plot(data1, marker='o')
ax.plot(data2, marker='x')
ax.plot(data3, marker='^')
plt.show()

## グラフの色指定（color引数）
``ax.plot()``を実行する際に，color引数で色を指定することができます．  
カラー指定のバリエーションは[公式ホームページ](https://matplotlib.org/stable/gallery/color/named_colors.html)に詳しく載っています．

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.plot(data1, marker='o', color='red')    #color='red'とすれば赤になる
ax.plot(data2, marker='x', color='blue')   #color='blue'とすれば青になる
ax.plot(data3, marker='^', color='#00ff00')#RGB値で指定することもできる
plt.show()

## グラフの凡例をつける（label引数）
``ax.plot()``を実行する際に，label引数で凡例の名前を決めることができます．  
グラフに凡例名をつけておき，``ax.legend()``メソッドを使うことでグラフに表示できます．  
ちなみに``ax.legend()``メソッドのloc引数を指定することで位置を変更できます．  
位置のバリエーションは[こちらのページ](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.legend.html)
に詳しく載っています．

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.plot(data1, marker='o', color='red', label='Data1')  #label引数を使って，データの凡例の名前をそれぞれ
ax.plot(data2, marker='x', color='blue', label='Data2') #Data1, Data2, Data3と設定
ax.plot(data3, marker='^', color='green', label='Data3')
ax.legend(loc='upper right')
plt.show()

## 色々な線を描く （linestyle引数）
``ax.plot()``を実行する際に，linestyle引数で線の種類を決めることができます．  
線のバリエーションは[こちらのページ](https://matplotlib.org/stable/gallery/lines_bars_and_markers/linestyles.html)
に詳しく載っています．

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.plot(data1, marker='o', color='red', linestyle='solid')
ax.plot(data2, marker='x', color='blue', linestyle='dotted')
ax.plot(data3, marker='^', color='green', linestyle='dashed')
plt.show()


## 全部のせグラフ
ここまでやってきたことを全て実行するとこのようにグラフが書けます．

In [None]:
fig = plt.figure(dpi=200)
ax = fig.add_subplot(111)

ax.plot(data1, marker='o', color='red', label='Sample1', linestyle='--')
ax.plot(data2, marker='x', color='blue', label='Sample2', linestyle='-')
ax.plot(data3, marker='^', color='green', label='Sample3', linestyle=':')
ax.grid()
ax.set_title('random data', fontsize=20)
ax.set_xlabel('x axis', fontsize=20)
ax.set_ylabel('y axis', fontsize=20)

ax.legend(loc='upper right')
plt.show()

# 散布図の書き方
ここまでは，折れ線グラフの書き方を学んできました．
ここからは散布図の書き方をやっていきましょう．  

## サンプルデータの生成
散布図のデータとして使う乱数データを作り出しておきましょう．  
ここでは仮想的なデータとして男女それぞれ25人の年齢と身長に関するデータを生成します．  
m_ageが25人分の男性の年齢,m_heightが25人分の男性の身長だとし,
f_ageとf_heightは女性25人分のデータだとします．  
__（乱数で適当に生成したものであり，実際のデータではありません）__

In [None]:
np.random.seed(1)
N=25
#男性25人分の年齢と身長
m_age = (10 + 25 * np.random.rand(N)).astype(np.int)
m_height = 172 - 108 * np.exp(-0.2 * m_age) + 2 * np.random.randn(N)

#女性25人分の年齢と身長
f_age = (10 + 25 * np.random.rand(N)).astype(np.int)
f_height = 160 - 108 * np.exp(-0.3 * f_age) + 2 * np.random.randn(N)

## ax.scatter()による散布図のプロット
散布図を描写したい時は，``ax.scatter()``メソッドを使います．  
ここで，散布図を描くためにはx軸データとy軸データの二つが必要であることに気をつけましょう．  
``ax.scatter(X軸データ, Y軸データ)``のように実行します．

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.scatter(m_age, m_height)#X軸データが男性の年齢，Y軸データが男性の身長
ax.scatter(f_age, f_height)#X軸データが女性の年齢，Y軸データが女性の身長

## 色指定，マーカー指定，サイズ指定
散布図の場合でも，ax.plot()の時と同様に引数に値を指定することで，  
様々なグラフの修飾を行うことができます．
以下に``color``引数による色指定，``marker``引数によるマーカー指定，  
``s``引数によるサイズ指定の例を示します．

### 色指定（color引数）

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.scatter(m_age, m_height, color='blue')
ax.scatter(f_age, f_height, color='red')

### マーカー指定（marker引数）

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.scatter(m_age, m_height, color='blue', marker='o')
ax.scatter(f_age, f_height, color='red', marker='^')

### サイズ指定（s引数）

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.scatter(m_age, m_height, color='blue', s=20)
ax.scatter(f_age, f_height, color='red', s=60)

# 棒グラフの描き方
次にmatplotlibを使った棒グラフの作図方法についてみていきます．

## 棒グラフ用のランダムデータを作成する．
6つのランダムデータを``data``に代入し，
それぞれのデータの番号を``X``に代入しました．

In [None]:
np.random.seed(0)
N=6
data = np.random.rand(N)
X = list(range(N))
print(data)
print(X)

## 棒グラフの描写
棒グラフは``ax.bar()``メソッドを使って以下のように描くことができます．  
ここでも``ax.bar(X軸のラベル，Y軸のデータ)``というように  
X軸とY軸に相当する二つのデータが必要であることに気をつけましょう．

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.bar(X, data)   #Xとdataから棒グラフを作成
plt.show()

## 文字列によるX軸ラベル
X軸ラベルは数値である必要はなく任意の文字列でもOKです．
このようにすれば，バーごとにラベル付けすることができます．

In [None]:
Name = ["Tanaka","Sato","Suzuki","Honda","Andou","Goto"]

fig = plt.figure()
ax = fig.add_subplot(111)
ax.bar(Name, data)  #Nameとdataから棒グラフを作成
plt.show()

## 横向きの棒グラフ
ax.barh()メソッドを使えば，横向きの棒グラフを作成することもできます．

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.barh(Name, data)
plt.show()

## 積み上げ棒グラフの作り方
複数のデータを棒グラフにする場合，  
積み上げることで各データの割合を効果的に示せる場合があります．
そのような積み上げ棒グラフも簡単に作ることができます．

まずは，3つのサンプルデータを乱数で用意します．

In [None]:
np.random.seed(0)
N=6
data1 = np.random.rand(N)
data2 = np.random.rand(N)
data3 = np.random.rand(N)
X = list(range(N))

次に，それぞれ３つのデータを個別にグラフにしていきましょう．
複数のグラフを並べる際に，以下のようにすると綺麗に並べることができます．

In [None]:
fig = plt.figure(figsize=(9,3))
ax1 = fig.add_subplot(131)
ax1.bar(X, data1)

ax2 = fig.add_subplot(132)
ax2.bar(X, data2)

ax3 = fig.add_subplot(133)
ax3.bar(X, data3)
plt.show()

注目すべきなのは，
``ax1 = fig.add_subplot(131)``の部分です．  
これまで
``fig.add_subplot()``メソッドでは，
引数に``111``を与えてきました．  
この辺りは前に細かいことは考えなくていいと書きましたが， 
複数グラフを並べる場合にはこの数値の意味を知っておく必要があります．  
この数値は「グラフが何行何列に並ぶのか」と「その中で何番目のグラフなのか」を意味する数値になります．  
つまり``ax1 = fig.add_subplot(131)``とすれば，``ax1``というグラフは
1行3列グラフが並ぶ内の1番目のグラフということになり．  
つまり``ax2 = fig.add_subplot(132)``とすれば，``ax2``というグラフは
1行3列グラフが並ぶ内の2番目のグラフということになります．

それでは次に，三つのグラフを積み上げ棒グラフにしていきましょう．  
基本的には``ax.bar()``を繰り返せばいいのですが，
上に載せるバーをプロットする場合は，  
``bottom``引数に，より下にあるデータの合計を与えましょう．

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
ax.bar(X, data1)
ax.bar(X, data2, bottom=data1)
ax.bar(X, data3, bottom=data1+data2)

# 三次元グラフのプロット

matplotlibは三次元のグラフを描写することもできます．  
そのためには下記のようにmpl_toolkits.mplot3d モジュールから axes3d　ライブラリをimportします．
(細かいことはいいので呪文だと思ってください．)

In [None]:
from mpl_toolkits.mplot3d import axes3d

それから，三次元にプロットするためのデータを用意していきます．  
ここでは，  
$$
z = \sin(x) + \cos(y) + y \ \ (0 \leqq x \leqq 5 \pi, \ \pi \leqq y \leqq 6 \pi)
$$
という数式をグラフにしていくことにしましょう．

``np.linspace(初めの値，最後の値，個数)``というメソッドを使うと，  
「初めの値」から「最後の値」までを「個数」分割した等差数列が得られます．  
次に，``np.meshgreid()``というメソッドにより，  
``x``と``y``のベクトルを縦横に拡張した行列XとYを作ります．  
（三次元プロットに必要になります．）
そして``Z = np.sin(X) + np.cos(Y) + Y``とすることにより，  
XとYから各座標におけるZを作り出します．  
もし分かりにくければ，下のコードでprintした値を眺めればなんとなくやってることが分かると思います．


In [None]:
N =40
x = np.linspace(0, 5*np.pi, N)
y = np.linspace(np.pi, 5*np.pi, N)

X, Y = np.meshgrid(x, y)
Z = np.sin(X) + np.cos(Y) + Y

print("xの中身\n",np.round(x, 2))
print("yの中身\n",np.round(y, 2))
print("Xの中身\n",np.round(X, 2))
print("Yの中身\n",np.round(Y, 2))

得られたデータを三次元にプロットする場合は，  
``ax = fig.add_subplot()``する際に引数に``projection='3d'``を与えます．  
そして，``ax.plot()``メソッドではなく，``ax.plot_surface()``メソッドを使いましょう．

In [None]:

fig = plt.figure(figsize=(6,6))
ax = fig.add_subplot(111, projection='3d')  #引数projectionに'3d'を与える
surf = ax.plot_surface(X, Y, Z)  #ax.plot_surfaceで三次元プロット
plt.show()

``ax.plot_surface()``メソッドでプロットする際に，
グラフのカラーのグラデーションを指定することができます．  
例えば``cmap``引数に``'bwr'``を与えるとしたのようになります．  
また，``fig.colorbar()``メソッドに，``ax.plot_surface()``によって作り出した``surf``を与えると  
グラフの横にカラーバーが表示されます．
カラーのバリエーションは[このページ](https://matplotlib.org/stable/tutorials/colors/colormaps.html)が参考になります．

In [None]:

fig = plt.figure(figsize=(6,6))
ax = fig.add_subplot(111, projection='3d')
surf = ax.plot_surface(X, Y, Z, cmap='bwr') #cmap引数でカラーマップを指定
fig.colorbar(surf)  #fig.colorbar()メソッドでカラーバーを表示
plt.show()

``ax.plot_surface()``メソッドを``ax.scatter3D()``に変えれば，
散布図の三次元グラフを描くこともできます

In [None]:
fig = plt.figure(figsize=(6,6))
ax = fig.add_subplot(111, projection='3d')
ax.scatter3D(X, Y, Z)
plt.show()

``ax.plot_surface()``メソッドを``ax.plot_wireframe``に変えれば，
メッシュ型の三次元グラフを描くこともできます

In [None]:

fig = plt.figure(figsize=(6,6))
ax = fig.add_subplot(111, projection='3d')
ax.plot_wireframe(X, Y, Z, linewidth=1)
plt.show()

## カラーマップによる表現
ここまで三次元にプロットしてきたデータは，
二次元のグラフにカラーマップとして示すこともできます．  
カラーマップをプロットする場合は``ax.imshow()``メソッドを使います．
（他にもやり方はあるのですがここでは割愛します．）

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
im = ax.imshow(Z)
fig.colorbar(im)
plt.show()

カラーマップの場合も``cmap``引数を指定することで，色のグラデーションを変更することができます．  
カラーのバリエーションは[このページ](https://matplotlib.org/stable/tutorials/colors/colormaps.html)が参考になります．

In [None]:
fig = plt.figure()
ax = fig.add_subplot(111)
im = ax.imshow(Z, cmap='jet')
fig.colorbar(im)
plt.show()

## おまけ　numpyを使った近似直線と曲線

In [None]:
np.random.seed(0)
N = 20
x = np.sort(np.random.uniform(0,5,N))
y_pure = 2 * x + 5
y = y_pure + np.random.uniform(-2,2,N)
plt.scatter(x, y)
plt.title("2x + 5 + noise")
plt.show()

In [None]:
a, b = np.polyfit(x, y, 1)
y2 = a * x + b

fig=plt.figure()
ax=fig.add_subplot(111)
ax.scatter(x,y, alpha=0.5, label="data")
ax.plot(x, y2,color='black', label="regression line", lw=2)
# ax.plot(x, y_pure,color='red', label="pure")
ax.legend()
ax.set_title("2x + 5 + noise")
ax.text(0.1,a*0.1+b, 'y='+ str(round(a,2)) +'x+'+str(round(b,2)), fontsize=15)
plt.show()

In [None]:
np.random.seed(0)
N = 20
x = np.sort(np.random.uniform(0,5,N))
y_pure = np.sin(x)
y = y_pure + np.random.uniform(-0.5,0.5,N)
plt.scatter(x,y)
plt.title("sin(x)+noise")
plt.show()

In [None]:
a, b, c = np.polyfit(x, y, 2)
x2 = np.arange(0, 5, 0.1)
y2 = a * x2**2 + b * x2 + c

fig=plt.figure()
ax=fig.add_subplot(111)
ax.scatter(x,y, alpha=0.5, label="data")
# ax.scatter(x, y_pure,color='red', label="pure")
ax.plot(x2, y2,color='black', label="regression line", lw=2)
ax.legend()
ax.text(0.1,a*0.1+b, 'y='+ str(round(a,2)) +'x**2+'+str(round(b,2)) +'x+' +str(round(c,2)), fontsize=15)
plt.show()

In [None]:
a, b, c, d = np.polyfit(x, y, 3)
x2 = np.arange(0, 5, 0.1)
y2 = a * x2**3 + b * x2**2 + c * x2 + d

fig=plt.figure()
ax=fig.add_subplot(111)
ax.scatter(x,y, alpha=0.5, label="data")
# ax.scatter(x, y_pure,color='red', label="pure")
ax.plot(x2, y2,color='black', label="regression line", lw=2)
ax.legend()
ax.text(0.1,a*0.1+b, 'y='+ str(round(a,2)) +'x**3+'+str(round(b,2)) +'x**2+'+str(round(c,2)) +'x+' + str(round(d,2)), fontsize=15)
plt.show()

In [None]:
labels = ["E", "D", "C", "B", "A"] 
y = [10, 20, 30, 40, 50] 
ex = [0, 0, 0, 0, 0.1] 

fig=plt.figure()
ax=fig.add_subplot(111)
ax.pie(y, explode = ex, labels = labels, autopct = '%1.1f%%', startangle = 90) 
plt.show()