# Matplotlibのトレーニング♨

## [目次](TableOfContents.ipynb)
- [準備](#準備)
  - [インストール](#インストール)
  - [インポート](#インポート)
  - [jupyter上で利用するとき](#jupyter上で利用するとき)
- [表示](#表示)
  - [画像の表示](#画像の表示)
  - [ヒストグラム](#ヒストグラム)
  - [パレート図](#パレート図)
  - [散布図](#散布図)
  - [散布図行列](#散布図行列)
  - [ヒートマップ](#ヒートマップ)
  - [二次元プロット](#二次元プロット)
    - [三次関数グラフ](#三次関数グラフ)
    - [三角関数グラフ](#三角関数グラフ)
  - [三次元プロット](#三次元プロット)
  
## 参考
開発基盤部会 Wiki
- Matplotlib  
https://dotnetdevelopmentinfrastructure.osscons.jp/index.php?Matplotlib

## 準備
プロキシ環境の場合などについては、[コチラ](PythonTraining.ipynb)をご参照ください。

### インストール

In [None]:
!pip install numpy
!pip install pandas
!pip install openpyxl
!pip install matplotlib
!pip install seaborn

### インポート

In [None]:
import io
import requests

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
import warnings
warnings.filterwarnings('ignore')

### jupyter上で利用するとき

In [None]:
%matplotlib inline

## 表示

### 画像の表示

#### 事前に画像ファイルを配置しておく。

In [None]:
#from matplotlib.image import imread
#img=imread('img1.jpg')
#plt.imshow(img)
#plt.show()

#### 画像ファイルをダウンロードして...

##### 画像ファイルをダウンロードして保存
必要に応じて[環境変数にプロキシ設定](PythonTraining.ipynb)をしておくと良い。

In [None]:
proxies = { # プロキシ設定
"http":"http://<user_name>:<password>@<proxy_host>:<proxy_port>/",
"https":"https://<user_name>:<password>@<proxy_host>:<proxy_port>/"
}

url = 'https://dotnetdevelopmentinfrastructure.osscons.jp/image/pukiwiki.png'
res = requests.get(url) # , verify=False, proxies=proxies) # プロキシ
with open('img1.jpg', 'wb') as saveFile : saveFile.write(res.content)

##### ダウンロードした画像ファイルを表示

In [None]:
from matplotlib.image import imread
img=imread('img1.jpg') # io.BytesIO(res.content))
plt.imshow(img)
plt.show()

### ヒストグラム

#### データの生成

##### 最も単純な例

In [None]:
x = np.random.normal(70, 10, 1000) # 平均70・標準偏差10のデータ1000個

##### 階層別表示の例

In [None]:
y=[0,1,2]
# valのベクトルを生成し、ｎ行１列の２次元配列（行列）化
y[0]=np.random.normal(50, 10, 1000).reshape(-1, 1) # 平均50・標準偏差10のデータ1000個
y[1]=np.random.normal(150, 20, 1000).reshape(-1, 1) # 平均150・標準偏差20のデータ1000個
y[2]=np.random.normal(100, 30, 1000).reshape(-1, 1) # 平均100・標準偏差30のデータ1000個
# clsのベクトルを生成し、ｎ行１列の２次元配列（行列）化して、valとclsを結合（ｎ行２列の２次元配列（行列）
y[0]=np.hstack([y[0], np.full(1000, 0).reshape(-1, 1)])
y[1]=np.hstack([y[1], np.full(1000, 1).reshape(-1, 1)])
y[2]=np.hstack([y[2], np.full(1000, 2).reshape(-1, 1)])
# numpy.ndarray（行列）をDataFrame化
y[0]=pd.DataFrame(y[0],columns=['val','cls'])
y[1]=pd.DataFrame(y[1],columns=['val','cls'])
y[2]=pd.DataFrame(y[2],columns=['val','cls'])
# ３つのclsのDataFrameを結合
df=y[0]
df=pd.concat([df,y[1]],axis=0)
df=pd.concat([df,y[2]],axis=0)
# インデックス再設定
df.index=np.arange(len(df))

#### データの可視化

##### 最も単純な例

###### binsの自動算出

In [None]:
plt.hist(x)
plt.show()

###### 最適なbinsを算出
- bins : ビン (表示する棒) の数
- スタージェスの公式（1+log2n）を基に最適なbinsを算出

In [None]:
import math
bins = math.log(len(x), 2) + 1
plt.hist(x, bins=round(bins))
plt.show()

##### 階層別表示の例
cls列の値（階層）毎にグループ分けしてval値をヒストグラムで可視化

In [None]:
for _class, _color in zip([0,1,2], ['r','g','b']):
    plt.hist(df[df.cls==_class]['val'], bins=round(bins), alpha=0.3, color=_color)
plt.show()

### パレート図
結構手数が要る。

### 散布図

#### データの生成
線形単回帰している風のデータを生成する。

##### データ１

In [None]:
np.random.seed(0) # 乱数生成器の状態を指定
x1=np.random.normal(50,10,100) # 平均50 標準偏差10の正規分布データ100個
y1=x1+np.random.normal(0,10,100) # 線形単回帰している風のxに対応するyの値

##### データ２
より、相関係数が大きい感じのデータ。

In [None]:
np.random.seed(0) # 乱数生成器の状態を指定
x2=np.random.normal(30,10,100) # 平均30 標準偏差10の正規分布データ100個
y2=2*x2+np.random.normal(0,10,100) # 線形単回帰している風のxに対応するyの値

#### データの可視化

##### scatterメソッド

###### データ１

In [None]:
plt.scatter(x1,y1)
plt.show()

###### データ２

In [None]:
plt.scatter(x2,y2)
plt.show()

##### scatterメソッドのオプション

###### １つのデータ群

In [None]:
# 最も単純な例
plt.scatter(x1,y1)
plt.show()

In [None]:
# 修飾を加えた例
## データ１
plt.scatter(x1,y1)
plt.title('title') # グラフのタイトル
plt.xlabel('x-label') # x軸のラベル
plt.ylabel('y-label') # y軸のラベル
plt.xticks(np.arange(0,100,10)) # 下限,上限,間隔
plt.yticks(np.arange(0,150,10)) # 下限,上限,間隔
plt.grid() # グリッド線を表示
plt.show()

In [None]:
# 修飾を加えた例
## データ２
plt.scatter(x2,y2)
plt.title('title') # グラフのタイトル
plt.xlabel('x-label') # x軸のラベル
plt.ylabel('y-label') # y軸のラベル
plt.xticks(np.arange(0,100,10)) # 下限,上限,間隔
plt.yticks(np.arange(0,150,10)) # 下限,上限,間隔
plt.grid() # グリッド線を表示
plt.show()

###### ２つのデータ群

In [None]:
plt.scatter(x1,y1,color='red',marker='x',label='data1')
plt.scatter(x2,y2,color='blue',marker='+',label='data2')
plt.title('title') # グラフのタイトル
plt.xlabel('x-label') # x軸のラベル
plt.ylabel('y-label') # y軸のラベル
plt.xticks(np.arange(0,100,10)) # 下限,上限,間隔
plt.yticks(np.arange(0,150,10)) # 下限,上限,間隔
plt.grid() # グリッド線を表示
plt.show()

### 散布図行列
matplotlibラッパであるseabornを使って、  
表の全ペアのヒストグラムと散布図を表示。  
（dfは数値表として初期化されたDataFrame）

#### データの生成

##### 準備
scikit-learnのデータセットを使う

In [None]:
!pip install scikit-learn

##### 生成

In [None]:
from sklearn import datasets
iris = datasets.load_iris()
df_data = pd.DataFrame(iris.data, columns=iris.feature_names)
df_target = pd.DataFrame(iris.target, columns=['species'])
df = pd.concat([df_data, df_target], axis=1)
df.head()

#### データの描画

In [None]:
sns.pairplot(df, height=2.0)
plt.show()

### ヒートマップ

#### データの生成

In [None]:
# 10x12 の一様乱数を生成
np.random.seed(0)
uniform_data = np.random.rand(10, 12)

#### データの描画

In [None]:
# 図表のサイズを指定
plt.figure(figsize=(10, 7))

# numpy.ndarray（行列）でもDataFrameでもOK
# annot : 数値を表示するかどうか(annotation)
# square: 四角を正方形に合わせるかどうか
# fmt   : 表示する数値の形式(formatting)
sns.heatmap(uniform_data, annot=True, square=True, fmt='.2f')

plt.show()

### 2次元のプロット

#### 3次関数グラフ 

##### データの生成
コチラは関数なので、式（y=x^3+x^2x+x+1）からデータを生成する感じ。

In [None]:
#x座標
x=np.arange(-10,10,0.1) # -10 - +10まで0.1刻みの配列
#x座標
y=0.01*(x**3+x**2+x+1)  # 三次関数：y=x^3+x^2x+x+1

##### データの可視化
グラフのプロット

###### 最も単純な例

In [None]:
plt.plot(x,y)  # グラフをプロットする
plt.show()     # グラフを表示する

###### 修飾を加えた例
[前述の修飾項目](#１つのデータ群)を除く

In [None]:
plt.plot(x,y) # グラフをプロットする
plt.hlines([0], -5, 5, linestyles='dashed', color='gray') # x軸に平行な直線を表示
plt.vlines([0], -1, 1, linestyles='dashed', color='gray') # y軸に平行な直線を表示
plt.xlim([-5, 5])  # x軸方向の表示範囲を指定
plt.ylim([-1, 1])  # y軸方向の表示範囲を指定
plt.show() # グラフを表示する

#### 3角関数グラフ

##### sin関数グラフ

###### データの生成
sin関数からデータを生成する。

In [None]:
#x座標
x=np.arange(0,6,0.1) # 0 - 6まで0.1刻みの配列
#y座標
y=np.sin(x)

###### データの描画

In [None]:
#グラフ描画
plt.plot(x,y)
plt.show()

##### sin, cos関数グラフ

###### データの生成

In [None]:
#x座標
x=np.arange(0,6,0.1) # 0 - 6まで0.1刻みの配列
#y座標
y1=np.sin(x)
y2=np.cos(x)

###### データの描画

In [None]:
#グラフ描画
plt.plot(x,y1, label="sin")
plt.plot(x,y2, linestyle="--", label="cos")
plt.xlabel("x")
plt.ylabel("y")
plt.title("sin & cos")
plt.legend()
plt.show()

### 3次元のプロット

#### 準備
インポート

In [None]:
from mpl_toolkits.mplot3d import Axes3D

#### 追加

##### 点

In [None]:
# (x, y, z)
x = np.random.rand(50)
y = np.random.rand(50)
z = np.random.rand(50)

# 図表の定義
fig = plt.figure()
#ax = Axes3D(fig)
ax = fig.add_subplot(projection='3d')

# 3Dでプロット
ax.scatter(x, y, z)

# ラベル
ax.set_xlabel('X-label')
ax.set_ylabel('Y-label')
ax.set_zlabel('Z-label')

##### 線

###### 直線

In [None]:
# (x, y, z)
x = [1, 2, 3, 4, 5]
y = [1, 2, 3, 4, 5]
z = [1, 2, 3, 4, 5]

# 図表の定義
fig = plt.figure()
#ax = Axes3D(fig)
ax = fig.add_subplot(projection='3d')

# 3Dでプロット
ax.plot(x, y, z, "o-")

# ラベル
ax.set_xlabel('X-label')
ax.set_ylabel('Y-label')
ax.set_zlabel('Z-label')

###### 曲線

In [None]:
# (x, y, z)
x = np.linspace(0, 8 * np.pi, num=50)
y = x * np.cos(x)
z = x * np.sin(x)

# 図表の定義
fig = plt.figure()
#ax = Axes3D(fig)
ax = fig.add_subplot(projection='3d')

# 3Dでプロット
ax.plot(x, y, z, "o-")

# ラベル
ax.set_xlabel('X-label')
ax.set_ylabel('Y-label')
ax.set_zlabel('Z-label')

##### 面

###### 平面

In [None]:
# (x, y, z)
# 2次元のグリッド座標
x, y = np.meshgrid(np.arange(0, 40, 2.5), np.arange(1, 10, 0.5))
# 平面の式
z = 2*x + 3*y + 4 

# 図表の定義
fig = plt.figure()
#ax = Axes3D(fig)
ax = fig.add_subplot(projection='3d')

# 3Dでプロット
ax.plot_wireframe(x,y,z)

# ラベル
ax.set_xlabel('X-label')
ax.set_ylabel('Y-label')
ax.set_zlabel('Z-label')

###### 曲面

In [None]:
# (x, y, z)
# 2次元のグリッド座標
x, y = np.meshgrid(np.arange(-3, 3, 0.25), np.arange(-3, 3, 0.25))
# 曲面の式
z = np.sin(x)+ np.cos(y)

# 図表の定義
fig = plt.figure()
#ax = Axes3D(fig)
ax = fig.add_subplot(projection='3d')

# 3Dでプロット
ax.plot_wireframe(x,y,z)

# ラベル
ax.set_xlabel('X-label')
ax.set_ylabel('Y-label')
ax.set_zlabel('Z-label')