<div class="alert alert-block alert-info" style="background-color: #301E40; border: 0px; -moz-border-radius: 10px; -webkit-border-radius: 10px;">
<br/><br/>
<h1 style="font-size: 45px; color: white; align: center;"><center>
<img src="https://raw.githubusercontent.com/HumbleData/beginners-data-workshop/master/media/humble-data-logo-white-transparent.png" width="250px" /><br/><br/>
Data visualization with matplotlib

</center></h1>
</div>

![](https://matplotlib.org/_static/logo2_compressed.svg)

<div class="alert alert-block alert-warning" style="padding: 0px; padding-left: 20px; padding-top: 5px;"><h2 style="color: #301E40">
Import pyplot in matplotlib (and pandas)。
</h2><br>
</div>

[公式ドキュメント](https://matplotlib.org/gallery/index.html)を参照すると、下記のように書かれています

`matplotlib.pyplot` は、matplotlibをMATLABのように動作させるためのコマンドスタイル関数が集まっています。pyplotの関数それぞれが、図の作成、図内でプロット領域を作成、プロット領域で線を描画する、プロットにラベルを追加するなど、多様にグラフを変えることができます。

`pyplot`は、主にインタラクティブなプロットや、プログラムによるプロット生成の簡単なケースを対象としています。

![](https://miro.medium.com/max/2000/1*swPzVFGpYdijWAmbrydCDw.png)

In [None]:
%matplotlib inline
# this is for ipython interpreter to show the plot in Jupyter

import pandas as pd
import matplotlib.pyplot as plt

### データフレームをもう一度インポートし、pandas DataFrame として読み込み、df. に代入します。

In [None]:
df = pd.read_csv('../data/Penguins/penguins_clean.csv')

### データをもう一度見直してみましょう。

In [None]:
df.head()

### pandas の DataFrame.plot() を使いましょう。

pandas DataFrameオブジェクトには、'line'、'bar'、'hist'、'box'など、さまざまな種類の基本プロットを提供する`plot()`メソッドがあります。また、プロットのレイアウトやラベルを調整するための引数を設定することもできます。

`plot()`はバックグラウンドで`matplotlib.pyplot`を使用しているため、DataFrame のデータのプロットがより簡単になります。

以下のページを参考にしてください。：
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.plot.html

#### 例: 一般的な箱ひげ図

In [None]:
df.plot(kind='box')

私たちのデータの単位はバラバラです。したがって、プロットのために、ペンギンの体重以外の値は無視することにします。

In [None]:
df.drop(["body_mass_g"], axis=1).plot(kind='box')

#### 見やすくするために図のサイズ、タイトル、凡例を追加しましょう。

In [None]:
df.drop(["body_mass_g"], axis=1).plot(kind='box', figsize=(10,8), title='Box plot of different measurements of species of penguin', legend=True)

#### サブプロットを作成しましょう

In [None]:
df.plot(kind='box',
        subplots=True, layout=(2,2),
        figsize=(10,8), title='Box plot of different measurements of species of penguin', legend=True)

---

<div class="alert alert-block alert-warning" style="padding: 0px; padding-left: 20px; padding-top: 5px;"><h2 style="color: #301E40">
Exercise: Compare bill length of different species of penguin

</h2><br>
</div>


異なる種のペンギン間でくちばしの長さを比較するには、箱ひげ図を使用しましょう。異なる種類のペンギンを比較するためには、DataFrameを少し調整する必要があります。各列が異なるペンギンの種のくちばしの長さになるようにデータをピボットします。

####  データセットを準備します。

In [None]:
df_pivot = df.pivot(index=None, columns='species', values='bill_length_mm')
# tell the pivot() method to make the 'species' as columns, and using the 'bill_length_mm' as the value

In [None]:
df_pivot.sample(10)


#### df_pivot の箱ひげ図
これで、`df_pivot` に対して `plot()`を使うことができます。箱ひげ図を作成するにあたって、必ず引数`kind`を'box'に設定してください。また、`figsize`と`title`を適宜設定して、見た目を整えます。凡例も忘れずに設定します。

#### 応用練習

別の計測記録（例：体重）を使ってピボットした、自作 `df_pivot` を作成してみましょう。また、箱ひげ図ではなくヒストグラム（hist）を使ってみましょう。また、3つのサブプロットを持つプロットを作成し、それぞれがペンギン１種のヒストグラムになるようにしてみてください。


ここまで、`matplotlib.pyplot`を直接使って来ませんでした。というのも `df.plot()` は非常に便利ですが、場合によっては、プロットの内容をより細かく調整したり、より複雑なグラフを作成したい時があります。次の項では、`matplotlib.pyplot`（今は`plt`としてインポートされてる）を直接使います。

### データを適切に3つのタイプに分けましょう。

In [None]:
df['species'].unique()

In [None]:
df_adelie = df[df['species'] == 'Adelie']

In [None]:
df_chinstrap = df[df['species'] == 'Chinstrap']

In [None]:
df_gentoo = df[df['species'] == 'Gentoo']

### 散布図の例：くちばしの長さと幅のプロット

In [None]:
plt.scatter(df_adelie['bill_length_mm'], df_adelie['bill_depth_mm'], c='r')
plt.scatter(df_chinstrap['bill_length_mm'], df_chinstrap['bill_depth_mm'], c='g')
plt.scatter(df_gentoo['bill_length_mm'], df_gentoo['bill_depth_mm'], c='b')

#### 見やすくするために図のサイズ、タイトル、凡例を追加しましょう。

In [None]:
plt.figure(figsize=(10,8)) # set the size of the plot

plt.scatter(df_adelie['bill_length_mm'], df_adelie['bill_depth_mm'], c='r')
plt.scatter(df_chinstrap['bill_length_mm'], df_chinstrap['bill_depth_mm'], c='g')
plt.scatter(df_gentoo['bill_length_mm'], df_gentoo['bill_depth_mm'], c='b')

ax = plt.gca() #gca method tell the rest of the code to reference the plot we made

ax.set_xlabel('Bill Length (mm)')
ax.set_ylabel('Bill Width (mm)')
ax.set_title('Bill Length and Width for Different Species of Penguin')

ax.legend(('adelie', 'chinstrap', 'gentoo'))

### 散布図の練習: 足の長さと体重のプロット

では、自分でプロットを作ってみましょう。ラベルと凡例を設定したことを確認してください。

### ヒストグラムの例: くちばしの長さのプロット

In [None]:
plt.figure(figsize=(10,8))

plt.hist(df_adelie['bill_length_mm'], color='r', alpha=.5) # alpha set the transparency of the plot
plt.hist(df_chinstrap['bill_length_mm'], color='g', alpha=.5)
plt.hist(df_gentoo['bill_length_mm'], color='b', alpha=.5)

ax = plt.gca()

ax.set_xlabel('Bill Length (mm)')
ax.set_title('Histogram of Bill Length for Different Species of Penguin')

ax.legend(('adelie', 'chinstrap', 'gentoo'))