# matplotlib

matplotlibはPythonの標準的なグラフ作成ライブラリで、豊富な機能を持っているが、ここでは機械学習で必要となる次のような用途を想定して、その一部を紹介する。

- 学習の進捗などのグラフを作成する
- 画像を簡易的に表示する

詳細な機能は下記のサイトなどを参考にすると良い。

- http://www.turbare.net/transl/scipy-lecture-notes/intro/matplotlib/matplotlib.html
- https://qiita.com/skotaro/items/08dc0b8c5704c94eafb9

インストールはpipを使って行う。

ライブラリ読み込みと、画像のインライン表示設定。

慣例で、グラフ描画オブジェクトpyplotはpltという短縮系を使う。

In [None]:
import matplotlib.pyplot as plt

# グラフをjupyter notebook内に表示する設定
%matplotlib inline

# グラフに日本語を表示するための設定

matplotlibは既定では英字フォントを使用するように設定されているため、そのままでは日本語が表示できません。
また、matplotlibで使用できるフォントファイルの形式が限定されているため、OS標準のフォントが使えない場合があります。

オープンソースのフォントをインストールし設定を変更する必要がありますが、手順が煩雑なため、ここではIPAフォントを含むPythonのモジュールをインストールして使用することにします。
なお、手動での対応方法については、このノートブックの末尾に参考として記載してあります。

### japanize-matplotlib のインストール

In [None]:
!pip install japanize-matplotlib

### japanize_matplotlib のインポート

In [None]:
import japanize_matplotlib

# matplotlibによるグラフ描画の基本

## 1変数の折れ線グラフ

描画用のサンプルデータを生成。ランダムウォークの数列を作ってみる。

In [None]:
import numpy as np

r = np.random.randn(30)
r

In [None]:
y = np.cumsum(r)
y

<code>np.cumsum()</code>関数は引数（配列）の累積和配列を生成する関数。

In [None]:
plt.plot(y)
plt.show()

1変数の場合には、x軸（横軸）にはインデックスが使われる。

## 2変数の折れ線グラフ

In [None]:
x = np.arange(0, 3.14 * 3, 0.1)
y = np.sin(x)

In [None]:
plt.plot(x, y)
plt.show()

plot()関数を複数回呼ぶと、同じグラフに上書きされる。

In [None]:
y1 = np.sin(x)
y2 = np.cos(x)

plt.plot(x, y1)
plt.plot(x, y2)
plt.show()

### ラベルの設定

In [None]:
plt.rcParams['font.family'] = 'IPAexGothic'

In [None]:
y1 = np.sin(x)
y2 = np.cos(x)

plt.plot(x, y1)
plt.plot(x, y2)
plt.title('タイトル')
plt.xlabel('X軸')
plt.ylabel('Y軸')
plt.show()

### 凡例の設定

In [None]:
y1 = np.sin(x)
y2 = np.cos(x)

plt.plot(x, y1, label='Y1')
plt.plot(x, y2, label='Y2')
plt.title('タイトル')
plt.xlabel('X軸')
plt.ylabel('Y軸')
plt.legend()
plt.show()

## 散布図

plot()関数でマーカーを指定すると、折れ線グラフではなく散布図となる。

In [None]:
x = [1, 2, 3, 4]
y = [8, 12, 4, 7]

plt.plot(x, y, 'o')
plt.show()

詳細な設定はマニュアルを参照。

- http://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.plot

## ヒストグラム

In [None]:
x = np.random.normal(0, 1, 10000)

plt.hist(x, bins=50)
plt.show()

## 配列を画像として表示

In [None]:
x = np.random.rand(3, 3)
print(x)

plt.imshow(x, cmap='coolwarm')
plt.show()

(縦, 横, 3)の3次元配列はRGBとして扱われる。  
(縦, 横, 4)の3次元配列はアルファチャネル（透明度）付きのRGBとして扱われる。  

In [None]:
x = np.random.rand(3, 3, 3)
print(x)

plt.imshow(x)
plt.show()

## グラフをファイルに書き出す

In [None]:
x = np.arange(0, 3.14 * 3, 0.1)
y1 = np.sin(x)
y2 = np.cos(x)

plt.plot(x, y1, label='Y1')
plt.plot(x, y2, label='Y2')
plt.title('タイトル')
plt.xlabel('X軸')
plt.ylabel('Y軸')
plt.tight_layout()
plt.legend()
plt.savefig('wave_chart.png')

plt.tight_layout()関数は、軸ラベル等がはみ出さないように適宜調整するための関数。

plt.savefig() ではファイルの拡張子でファイル形式が自動選択される。

# Pillowによる画像操作

## インストール

## 画像ファイルの読み込みと表示

In [None]:
from PIL import Image

img = Image.open('wave_chart.png')
img.show()

<code>show()</code>メソッドでは、OS既定の画像ファイル表示アプリケーションが呼び出される。

## 画像をNumpy配列に変換

In [None]:
img_array = np.array(img)
print(img_array.shape)

In [None]:
plt.imshow(img_array)
ｐｌｔ.axis('off')
plt.show()

<code>plt.axis('off')</code> は軸を消すための指定。

## Numpy配列を画像に変換

In [None]:
x = np.random.randint(0, 255, 32 * 32 * 3)
x = x.reshape(32, 32, 3)

# 画像に変換するにはnp.uint8()で8ビット符号なし整数に変換する必要あり。
img = Image.fromarray(np.uint8(x))
img.save('rgb.png')

なお、Pillowでは様々な画像の操作が可能である。詳しくは下記を参照。

- http://pillow.readthedocs.io
- https://qiita.com/pashango2/items/145d858eff3c505c100a

## ＜参考＞手動でmatplotlibのフォントを日本語対応にする方法

### オープンソースフォントのインストール

matplotlibの既定のフォントは"DejaVu Sans"で日本語には対応していない。

また、matplotlibで使えるフォントの形式はTTF形式あるいはOTF形式に限られる。
特にWindows10では日本語フォントはTTC形式がほとんどであり、TTF形式のフォントは「游明朝」"Yu Mincho"くらいしかない。

このため、TTFあるいはOTF形式のオープンソースフォントを使うことが多い。例としてはGoogleやIPAのフォントがある。

- https://www.google.com/get/noto/
-- Noto Sans CJK JP, Noto Serif CJK JP
- https://ipafont.ipa.go.jp/node26#ja
-- IPAexGothic, IPAexMincho

フォントのインストール方法はOSによって異なるが、Windows 10ではコントロールパネルからフォントを開き、解凍したTTFファイル（あるいはOTFファイル）をドラッグ&ドロップすればインストールできる。


### matplotlibで使用可能なフォントを表示

In [None]:
import matplotlib.font_manager as fm

fm.findSystemFonts()

#### フォントキャッシュの削除

matplotlibが使用するフォントファイルのリストはキャッシュされるため、フォントのインストールなどを行なった場合には、キャッシュファイルの削除を行う必要がある。

フォントキャッシュはユーザーのホームディレクトリの.matplotlibディレクトリに作成される。下記のような名前のファイルである。

- fontList.json
- fontList.py3k.cache

### matplotlibで使用するフォントの設定

#### matplotlibrcファイルによる設定

matplotlib全体の設定はmatplotlibrcファイルで設定される。

matplotlibrcファイルの場所は下記のプログラムで確認できる。

In [None]:
import matplotlib as mpl

mpl.matplotlib_fname()

なお、ユーザーのホームディレクトリの.matplotlibディレクトリにmatplotlibrcを置くことができ、こちらが優先される。  
このため、設定を1箇所で管理し統一したい場合には、matplotlibファイルをこのディレクトリにコピーして編集することが推奨される。

```code:matplotlibrc
    #font.family         : sans-serif
    #font.style          : normal
    #font.variant        : normal
    #font.weight         : normal
    #font.stretch        : normal

    #font.size           : 10.0
    #font.serif          : DejaVu Serif, Bitstream Vera Serif, Computer Modern Roman, New Century Schoolbook, Century Schoolbook L, Utopia, ITC Bookman, Bookman, Nimbus Roman No9 L, Times New Roman, Times, Palatino, Charter, serif
    font.sans-serif     : IPAexGothic, DejaVu Sans, Bitstream Vera Sans, Computer Modern Sans Serif, Lucida Grande, Verdana, Geneva, Lucid, Arial, Helvetica, Avant Garde, sans-serif
    #font.cursive        : Apple Chancery, Textile, Zapf Chancery, Sand, Script MT, Felipa, cursive
    #font.fantasy        : Comic Sans MS, Chicago, Charcoal, ImpactWestern, Humor Sans, xkcd, fantasy
    #font.monospace      : DejaVu Sans Mono, Bitstream Vera Sans Mono, Computer Modern Typewriter, Andale Mono, Nimbus Mono L, Courier New, Courier, Fixed, Terminal, monospace
```

既定では、font.family で sans-serif が指定され、font.sans-serif に指定されている優先順にフォントが選ばれている。  
font.family　に直接 IPAexGothic などのフォントファミリ名を指定することもできるが、上記の例では font.sans-serif　の筆頭に IPAexGothic を指定している。

指定する文字列はキャッシュにあるfontList.jsonの"name"に存在するものでなければならない。フォントをインストールしたにも関わらず、このファイルに存在しない場合には、キャッシュファイルを削除してみると良い。

#### プログラムからの設定変更

プログラムの先頭で下記のようにフォント関係のパラメータを一括指定して反映することができる。

In [None]:
import matplotlib as mpl

font = {"family":"IPAPGothic",
        "size": 12.0 }
mpl.rc('font', **font) # mpl.rc('font', family='IPAPGothic', size=12.0)

#### 使用する都度設定する方法

In [None]:
plt.rcParams['font.family'] = 'IPAexGothic'