# Matplotlibサンプルプログラム

## 1. 基本構成

Matplotlibを使ったグラフ描画プログラムは、主に以下の処理に分けられる。

1. グラフ化するデータの作成
2. プロット（plot()など）
3. 表示（show()）

sin, cosカーブの例を以下に示す。

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# 0から2*PI未満を等間隔で要素数500のarrayを作る
x = np.linspace(0, 2*np.pi, 500)

plt.plot(x,np.sin(x))
plt.plot(x,np.cos(x))

plt.show()

## 2. 線グラフ

plt.plot()で線グラフを作成する。

In [None]:
d =[0, 1, 4, 9, 16]
plt.plot(d)
plt.show()

X値とY値をそれぞれリストで与えることができる。

In [None]:
x =[0, 1, 2, 3, 4]
y =[0, 3, 6, 9, 12]

plt.plot(x,y)
plt.show()

In [None]:
# NumPyのarrayでも良い
array_x = np.array(x)
array_y = np.array(y)
plt.plot(array_x, array_y)
plt.show()

複数のグラフを描く場合。

In [None]:
# タプルでもOK
x = (0, 1, 2, 3, 4)
y1 = (0, 1, 2, 3, 4)
y2 = (0, 1, 4, 9, 16)

plt.plot(x, y1)
plt.plot(x, y2)
plt.show()

plt.plot()メソッドで、以下の設定を行う例を示す。
* 線の形状（linestyle）
* 線の色（color）
* マーカーの形状（marker）
* 凡例で示すグラフの名称（label）

plt.plot()メソッドの引数については、以下のドキュメントを参照。
https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.plot.html#matplotlib.axes.Axes.plot

In [None]:
plt.plot(x, y1, linestyle='--', color='blue', marker='o', label='data-1')
plt.plot(x, y2, linestyle=':', color='red', marker='*', label='data-2')
plt.legend()
plt.grid()  # グリッド表示
plt.show()

## 3. 散布図

plt.scatter()を使用する。plot()同様、X値とY値のリストを与えて描画する。

以下のパラメータを指定した例を示す。

* マーカーの大きさ（s）
* マーカーの色（color）
* マーカーの透明度（alpha）

In [None]:
x = np.random.rand(20)
y = np.random.rand(20)
plt.scatter(x, y, s=100, color='blue', alpha=0.5);
plt.show()

## 4. 棒グラフ

plt.bar()を使用する。

以下に例を示す。

In [None]:
x = [1, 2, 3, 4, 5]
y = np.random.rand(5)
plt.bar(x,y)
plt.show()

## 5. ヒストグラム

plt.hist()を使用する。サンプルのデータはリスト、あるいはarrayで与える。

In [None]:
# 平均0、分散1の標準正規分布に従う乱数
d = np.random.randn(100)
plt.hist(d, bins=5);
plt.show()

In [None]:
d = np.random.randn(100)
plt.hist(d, bins=20);  # binsの値を変えて実行
plt.show()

## 6. サッカー日本代表のデータをプロットする



In [None]:
import pandas as pd
df = pd.read_excel('data/日本サッカー代表2024.xlsx', index_col=0)
df

### 生年月日でヒストグラムを作成

In [None]:
plt.hist(df['生年月日'], bins=20);
plt.show()

### 出場合計のトップ10

Seriesにはplot.bar()という便利な機能がある。

In [None]:
import japanize_matplotlib
ser = df.sort_values(by='出場合計', ascending=False).head(10)['出場合計']
ser.plot.bar()
plt.show()

### 得点合計のトップ10

In [None]:
import japanize_matplotlib
ser = df.sort_values(by='得点合計', ascending=False).head(10)['得点合計']
ser.plot.bar()
plt.show()