## 講座 1.5 matplotlinb入門

In [None]:
# 日本語化ライブラリ導入
!pip install japanize-matplotlib | tail -n 1

In [None]:
# 共通事前処理

# 必要ライブラリのimport
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# matplotlib日本語化対応
import japanize_matplotlib

# データフレーム表示用関数
from IPython.display import display

# グラフのデフォルトフォント指定
plt.rcParams["font.size"] = 14

### 関数方式

#### 散布図

In [None]:
# データ準備
import seaborn as sns
df_iris = sns.load_dataset("iris")

# 結果確認
display(df_iris.head())

In [None]:
# 散布図x座標用Series
xs = df_iris['sepal_length']

# 散布図y座標用Series
ys = df_iris['sepal_width']

# サイズ設定
#plt.rcParams['figure.figsize'] = (6, 6)

# 散布図
plt.scatter(xs, ys)

# 描画
plt.show()

#### 関数グラフ

In [None]:
# データ準備

# シグモイド関数の定義
def sigmoid(x, a):
    return 1/(1 + np.exp(-a*x))

# グラフ描画用x座標リスト
xp = np.linspace(-3, 3, 61)

# グラフ描画用y座標リスト
yp = sigmoid(xp, 1.0)

print(xp)
print(yp)

#### 単純な例

In [None]:
# グラフ描画
plt.plot(xp, yp)

# 描画
plt.show()

#### 複雑な例

In [None]:
# 関数値計算
yp1 = sigmoid(xp, 1.0)
yp2 = sigmoid(xp, 2.0)

# ラベル付きグラフ描画 #1
plt.plot(xp, yp1, label='シグモイド関数1', lw=3, c='k')

# ラベル付きグラフ描画 #2
plt.plot(xp, yp2, label='シグモイド関数2', lw=2, c='b')

# 方眼表示
plt.grid()

# 凡例表示
plt.legend()

# 軸表示
plt.xlabel('x軸')
plt.ylabel('y軸')

# 描画
plt.show()

#### 時系列グラフ

In [None]:
# データ準備

# アイスクリーム消費量
fn_ice = 'l01_05_ice-sales.xlsx'
df_ice = pd.read_excel(fn_ice)

# 結果確認
display(df_ice.head())

In [None]:
# サイズ指定
plt.figure(figsize=(12, 4))

# グラフ描画
plt.plot(df_ice['年月'], df_ice['支出'], c='b')

# 3カ月区切りの目盛にする
import matplotlib.dates as mdates
days = mdates.MonthLocator(bymonth=range(1, 13, 3))
plt.gca().xaxis.set_major_locator(days)

# x軸ラベルを90度回転
plt.xticks(rotation=90)

# 方眼表示
plt.grid()

# 描画
plt.show()

### メソッド方式

#### 複数グラフ描画

In [None]:
# 項目名のリスト取得
columns = df_iris.columns[:4]

# 4x4のNumPy配列取得
x = df_iris.values[:,:4]

# 花の種別を整数値にエンコード
from sklearn.preprocessing import LabelEncoder
label_encoder = LabelEncoder()
y = label_encoder.fit_transform(df_iris['species'])

# 項目数の計算
N = x.shape[1]

print(columns)
print(x[:5])
print(y[:5])
print(N)

In [None]:
# figsize計算用(1要素あたりの大きさ)
u = 5
# ax 領域の2次元配列をaxesとして取得
fig, axes = plt.subplots(N, N, figsize=(u*N, u*N))

for i in range(N):
    for j in range(N):
        # 描画対象axの取得
        ax = axes[i, j]
        # 散布図表示
        ax.scatter(x[:, i], x[:, j], c=y, cmap='rainbow')
        # タイトル表示
        ax.set_title(columns[i] + ' vs ' + columns[j])
        # 方眼表示
        ax.grid()
# 隣接オブジェクトとぶつからないようにする
plt.tight_layout()

# 表示
plt.show()

### データフレーム方式

#### ヒストグラム表示

In [None]:
# ヒストグラム表示
df_iris.hist(bins=20,figsize=(6,6))

# 隣接オブジェクトとぶつからないようにする
plt.tight_layout()

# 表示
plt.show()

#### データ件数の棒グラフ表示

In [None]:
# データ準備

# df_iris['sepal_width']の値別個数を集計し、上位5件を取得
counts_ser = df_iris['sepal_width'].value_counts().sort_index()

# 結果確認
print(counts_ser.head())

In [None]:
# value_countsの結果を棒グラフ表示

# Seriesデータで棒グラフ表示
counts_ser.plot.bar(figsize=(6,6))

plt.grid()
plt.title('sepal_widthの分布')

# 隣接オブジェクトとぶつからないようにする
plt.tight_layout()

# 表示
plt.show()