# Python プログラミング入門  
copyright 2019 Jujukeisan.co.jp

本資料の目的  
Pythonでのグラフを描画を学ぼう  
  
**Matplotlib:** データビジュアライゼーションパッケージ  
**pyplot:** matplotlibパッケージ内のライブラリ群。基本的にはこのモジュール越しにmatplotlibの機能を活用する。

https://matplotlib.org/gallery/index.html

---

# ライブラリの読込み

In [None]:
import matplotlib.pyplot as plt # グラフ描画用ライブラリ
import numpy as np # 数値計算用ライブラリ

# グラフをインライン描画する際に指定
%matplotlib inline

---

# 折れ線グラフ　plotメソッド
1. linewidth：　線の太さ
1. linestyle：　線のスタイル (デフォルト値:”solid”)
   1. solid (実線)
   1. dashed(破線)
   1. dashdot(破線&点線)
   1. dotted(点線)
1. color：　線の色
1. marker：マーカーの種類　※https://matplotlib.org/api/markers_api.html#module-matplotlib.markers　参照

In [None]:
# データ生成
np.random.seed(1234) # 乱数初期値設定
x = np.linspace(0, 10, 100) # 0～10まで等間隔で100個データを生成
y = x + np.random.randn(100) # 100個乱数を生成して加算（正規分布(平均:0 分散:1)）

# グラフ作成
plt.plot(x,y,
         linewidth=1,
         linestyle="dotted",
         color="red",
         marker=".",
         label="ラベルです!")

# 凡例の表示
plt.legend()

# グラフの描画
plt.show()

---

# 棒グラフ　barメソッド
1. left：　各棒の X 軸上の数値
1. height：　各棒の高さ
1. color：　棒の色

In [None]:
# データ生成
left = np.array(["banana", "apple", "orange", "cherry", "melon"])
height = np.array([100, 200, 300, 400, 500])

# グラフ作成
plt.bar(left, 
        height,
        color="red")

# グラフの描画
plt.show()

---

# ヒストグラム　histメソッド  
1. bins：ビン (表示する棒) の数。階級数。(デフォルト値: 10)
1. normed：True に設定すると正規化 (合計値が 1 になるように変換) を実施。 (デフォルト値: False)
1. cumulative：True に設定すると、累積ヒストグラムを出力。 (デフォルト値: False)
1. histtype：ヒストグラムの描画タイプ(デフォルト値: ‘bar’)
   1. bar(通常のヒストグラム)
   1. barstacked(積み上げヒストグラム)
   1. step(線)
   1. stepfilled(塗りつぶしありの線) から選択。
1. orientation：棒の方向(デフォルト値: ‘vertical’)
   1. horizontal(水平方向)
   1. vertical(垂直方向) から選択。

In [None]:
# データ作成
np.random.seed(1234) # 乱数初期値設定
data = np.random.randn(1000) # 1000個乱数を生成して加算（正規分布(平均:0 分散:1)）

# ヒストグラムの作成
plt.hist(data,
         bins=20,
         normed=False,
         cumulative=False,
         histtype="bar",
         orientation="vertical")

# 描画
plt.show()

---

# 散布図　sccaterメソッド  
1. s：ドットの大きさ(デフォルト値: 20)
1. c：ドットの色 または、連続した色の値
1. marker：マーカーの形 (デフォルト値: ‘o’= 円)
1. cmap：カラーマップ。　※c が float 型の場合のみ利用可能


In [None]:
# データ作成
np.random.seed(1234) # 乱数初期値設定
x = np.random.randn(100)
y = np.random.randn(100)

# ヒストグラムの作成
plt.scatter(x,y,
            s=100,
            c="red",
            marker='.'
           )

# 描画
plt.show()

In [None]:
# データ作成
np.random.seed(1234) # 乱数初期値設定
x = np.random.randn(100)
y = np.random.randn(100)
value = np.random.randn(100)

# ヒストグラムの作成
plt.scatter(x,y,
            s=100,
            c=value,
            cmap='Blues'
           )

# カラーバーを表示
plt.colorbar()

# 描画
plt.show()

---

# 複数のグラフを並べて描画
1. figureインスタンスを生成する。 ※figsizeで縦横サイズ(インチ)を指定　デフォルトは(8,6)
1. plot()メソッドで指定データでグラフを作成
1. show()メソッドでグラフの描画

In [None]:
# データ生成
x = np.linspace(0, 10, 100) # 0～10まで等間隔で100個データを生成
y = x + np.random.randn(100) # 100個乱数を生成して加算（正規分布(平均:0 分散:1)）

# グラフ描画用のキャンバスを作成
plt.figure(figsize=(6, 3)) # figsizeで縦横サイズ(インチ)を指定　デフォルトは(8,6)
plt.plot(x, y) # グラフ作成

# グラフの描画
plt.show()

---

# グラフのレイアウトの仕方
<img src="images/images1.jpg">

## 並べて描画

In [None]:
# データ作成
x = np.linspace(0, 10, 20)
y1 = x
y2 = x ** 2 

# グラフ描画用のキャンバスを作成
plt.figure(figsize=(8, 3)) # figsizeで縦横サイズ(インチ)を指定　デフォルトは(8,6)

# 1つ目のグラフを作成
plt.subplot(1,2,1) # キャンパス内のどこに配置するかを指定。subplot(行の数,列の数,何番目に配置するか)
plt.plot(x, y1)

# 2つ目のグラフを作成
plt.subplot(1,2,2) # キャンパス内のどこに配置するかを指定。subplot(行の数,列の数,何番目に配置するか)
plt.plot(x, y2)

# グラフの描画
plt.show()

## 重ねて描画

In [None]:
# データ作成
x = np.linspace(0, 10, 20)
y1 = x
y2 = x ** 2 

# グラフ描画用のキャンバスを作成
plt.figure(figsize=(4, 3)) # figsizeで縦横サイズ(インチ)を指定　デフォルトは(8,6)

plt.subplot(1,1,1) # キャンパス内のどこに配置するかを指定。subplot(行の数,列の数,何番目に配置するか)
plt.plot(x, y1,label="y1")
plt.plot(x, y2,label="y2")

# 凡例
plt.legend()

# グラフの描画
plt.show()

---

# 便利なグラフライブラリ「Seaborn」
Pythonチャートを描く場合の定番は「matplotlib」ですが、その見た目のやや野暮ったい感じと、表記法のややこしさが指摘されています。  
Matplotlibの機能をより美しく、またより簡単に実現するためのラッパー的存在である、「Seaborn」を簡単にご紹介します。

## seabornライブラリのインストール

In [None]:
#!pip install seaborn

In [None]:
import seaborn as sns

In [None]:
# データのロード
iris = sns.load_dataset("iris")  ## Rでお馴染みのアヤメの統計データ

<img src="images/images2.png" width="700">

In [None]:
# iris（アヤメ）データセットの中身
# Sepal：がく　Petal：花弁
iris.head()

---

# ヒストグラム distplotメソッド
1. kde：　密度近似関数の描画（デフォルト：True）
1. bins：　x軸の刻み目の指定

In [None]:
sns.distplot(iris["sepal_length"], kde=True, bins=20) 

---

# 散布図 jointplotメソッド
散布図の他にそれぞれのヒストグラムも同時に表示

In [None]:
sns.jointplot(x='sepal_length', y='sepal_width', data=iris)

# 散布図たくさん pairplotメソッド
全ての組合せで散布図を作成してくれます。

In [None]:
sns.pairplot(data=iris,hue="species")

# Seabornサイト
## https://seaborn.pydata.org/index.html