## 4-4-1 グラフの作成

### ライブラリーのインポート

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

- pandas
  - データ分析を効率的に行うためのライブラリ
  - https://pandas.pydata.org/docs/
- matplotlib
  - グラフ描画のためのライブラリ
  - https://matplotlib.org/stable/contents.html

### データの読み込み

In [None]:
df = pd.read_csv('data/NOx_data.csv', parse_dates=['date'], index_col='date')
df.head(3)

- pd.read_csv(ファイル名, ･･･ )
  - CSVファイルの読み込み
  - 読み込み時に「date」列を日付型およびインデックスに設定する

### 月単位で集計

In [None]:
df_m = df.copy()
df_m.index = df_m.index.map(lambda x: x.month)
df_m = df_m.groupby(level=0).sum()
df_m.index.names = ['month']
df_m.head()

- df.copy：Pandasデータフレーム（df）のコピーを作成する
- df_m.index.map(lambda x: x.month)：インデックスの年月を月のみに置き換える
  - map：1項目データの置き換え処理
  - lambda 引数: 返り値 → 無名関数（名前を持たない関数）
- df_m.groupby(level=0).sum()：月毎に集めて合計を計算する
  - groupby(level=0)：月毎のグループ化
  - sum()：合計の計算
- df_m.index.names：df_mのインデックス名称

### 縦棒グラフ（コラムチャート）

In [None]:
column_chart = df_m.plot.bar(figsize=(12,4), grid=True)

- df_m.plot.bar()：df_mデータのコラムチャート作成
  - figsize=()：描画領域のサイズ指定
  - grid=True：グリッド線の表示指定

### 円グラフ（パイチャート）

In [None]:
pie_chart = df_m.plot.pie(
    figsize=(14, 14), subplots=True, autopct='%.1f', legend=False)

- df_m.plot.pie()：df_mデータのパイチャート作成
  - figsize=()：描画領域のサイズ指定
  - subplots=True：全項目のグラフ描画指定
  - autopct='%.1f'：データの値表示の指定（小数点以下1桁）
  - legend=False：凡例表示のオフ

### 帯グラフ（バンドチャート）

In [None]:
df_ms = df_m.apply(lambda x: x / x.sum(), axis=1)
band_chart = df_ms.plot.barh(figsize=(8,6), stacked=True)

- df_m.apply(lambda x: x / x.sum(), axis=1)
  - df_m各月のデータを百分率に変換する
  - apply(function, axis)：複数項目データの置き換え処理
  - axis=1：行ごとの処理（sensor_01、02、03）
- df_ms.plot.barh：df_msデータのバンドチャートの作成
  - figsize=()：描画領域のサイズ指定
  - stacked=True：積み上げグラフの指定

### 折れ線グラフ（ラインチャート）

In [None]:
line_chart = df_m.plot.line(figsize=(8,4), grid=True)

- df_m.plot.line()：df_mのラインチャート作成
  - figsize=()：描画領域のサイズ指定
  - grid=True：グリッド線の表示指定

### 箱ひげ図（ボックスプロット）

In [None]:
box_plot = df_m.plot.box(grid=True)

- df_m.plot.box(grid=True)：df_mの箱ひげ図作成
  - grid=True：グリッド線の表示指定

### 散布図（スキャタープロット）

In [None]:
scatter_plot_1 = df.plot.scatter(
    figsize=(8,4), x='sensor_01', y='sensor_02', grid=True)
scatter_plot_2 = df.plot.scatter(
    figsize=(8,4), x='sensor_01', y='sensor_03', grid=True)

- df.plot.scatter()：dfのスキャッタープロット作成
  - figsize=()：描画領域のサイズ指定
  - x='項目名', y='項目名'：x軸とy軸の項目名の指定
  - grid=True：グリッド線の表示指定

### ヒストグラム（個別）

In [None]:
hist = df.hist(figsize=(10,8))

- df.hist()：dfの各項目それぞれのヒストグラムを作成
  - figsize=()：描画領域のサイズ指定

### ヒストグラム（統合）

In [None]:
hist = df.plot(kind='hist', grid=True)

- df.plot()：df各項目のグラフを1つの領域に描画
  - kind='hist'：グラフの種類をヒストグラムに設定
  - grid=True：グリッド線の表示指定