# グラフ、画像の表示

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/kyorin-phys/MLIntro/blob/main/1/1b.ipynb)

## matplotlib ライブラリ
* [matplotlib](https://matplotlib.org/)

[グラフの種類一覧](https://matplotlib.org/stable/plot_types/index.html)



In [None]:
import matplotlib.pyplot as plt
x = [1,2,3,4,5]
y = [3,6,9,12,15]
#plt.plot(x, y) # 線を引く
plt.scatter(x, y) # 散布図（点のみ）
plt.show()

In [None]:
# 軸ラベルやタイトル、目盛線、凡例の追加
plt.plot(x, y, label='y')
plt.xlabel('x')
plt.ylabel('y')
plt.title('title')
plt.grid()
plt.legend()
plt.show()

In [None]:
# 日本語は文字化けするので、japanize_matplotlib をインポートする
!pip install japanize_matplotlib
import japanize_matplotlib
plt.plot(x, y, label='y')
plt.xlabel('x軸')
plt.ylabel('y軸')
plt.title('タイトル')
plt.legend()
plt.show()

## seaborn ライブラリ　
統計用グラフが充実
* [seaborn](https://seaborn.pydata.org/index.html)

[グラフ一覧](https://seaborn.pydata.org/examples/index.html)

In [None]:
# アヤメデータ
import seaborn as sns # なぜSNSと略すのかはアメリカのテレビ番組が由来なので説明されてもわからない
from sklearn.datasets import load_iris
print(sns.get_dataset_names()) # seabornに含まれるサンプルデータ
iris = sns.load_dataset('iris')
iris 

<img src="https://miro.medium.com/max/1000/1*Hh53mOF4Xy4eORjLilKOwA.png" width="50%">

In [None]:
# sepal_length, sepal_widthで散布図、hue で層別に色分け
sns.relplot(data=iris, x='sepal_length',y='sepal_width', hue='species')

In [None]:
# 散布図行列
sns.pairplot(iris, hue='species')

In [None]:
# 相関行列
corr = iris.corr(numeric_only=True)
corr

In [None]:
# ヒートマップ
sns.heatmap(corr, cmap='coolwarm',annot=True)

* 練習問題
データセット penguins を読み込んで同様なグラフを描いてみよ

<img src="https://allisonhorst.github.io/palmerpenguins/reference/figures/lter_penguins.png" width='30%'>

In [None]:
penguins = sns.load_dataset('penguins')
penguins

In [None]:
# bill_length, bill_depth で散布図
sns.relplot(penguins, x='bill_length_mm', y='bill_depth_mm',hue='species')

In [None]:
# 散布図行列
sns.pairplot(penguins, hue='species')

In [None]:
# 相関行列
corr = penguins.corr(numeric_only=True)
corr

In [None]:
# ヒートマップ
sns.heatmap(corr, cmap='coolwarm',annot=True)

## ライブラリ

機能（関数）を拡張する
* numpy （数値演算、行列演算）
* matplotlib (グラフ)
* pandas （テーブルデータ、統計）


`import numpy as np`
numpy を np という短縮名で読み込む。
三角関数、指数関数などの数学関数はインポートしないと使えない。
math というライブラリもあるが、機械学習では多次元の配列を使うので numpy を使う。

`from numpy import pi`
と宣言すると、piが使える。
`import numpy as np`
だけ宣言した場合は
`np.pi` とする必要がある。

In [None]:
import numpy as np
# print(pi) # エラーになる
print(np.pi)
from numpy import pi
print(pi)

## numpy 配列
リストの場合は要素ごとに演算が必要だが、numpy配列ではまとめて演算できる。
例：すべての値を2倍する
リストの場合
```
a = [1,2,3,4,5]
a = [i*2 for i in a]
```

In [None]:
# 2倍するつもりが、リストをつなぐ結果に
a = [1, 2, 3, 4, 5]
print(a * 2)
print(a + a)

In [None]:
# 全ての要素を2倍する
a = [1, 2, 3, 4, 5]
a = [x*2 for x in a]  #リスト内包表記
print(a)
# for文は遅いのでなるべく避けた方がよい
a = [1, 2, 3, 4, 5]
for i in range(len(a)):
    a[i] *= 2  # i番目の要素を2倍
print(a)


In [None]:
# ベクトルの定数倍と同様にすべての要素が2倍になる
b = np.array([1, 2, 3, 4, 5])
print(b)
print(b * 2)
print(type(b))

In [None]:
# 全ての要素に2を足す
# print(a + 2) # リストと数値は足せない
# broadcast 2*np.oneslike(b) 
print(b + 2)
print(np.ones_like(b))

In [None]:
# 積は同じインデックスの要素同士を掛ける
a = [1, 2, 3, 4, 5]
print(a * b) # これは可能
print(b * b)
c = np.array([1,2,3])
# print(b*c) # 長さの違う配列の積は計算できないのでエラー

In [None]:
## ベクトルの内積
a = np.array([1,2])
b = np.array([2,-1])
print(np.dot(a, b))

## 行列 多次元配列

* 1次元の配列: ベクトル(vector)
* 2次元の配列: 行列(matrix)
* 3次元以上の配列: テンソル(tensor)

例:モノクロ画像は2次元のデータからなる。
カラー画像は色情報がRGBの3チャンネルを持つ2次元データを組み合わせたもの。

CTなどの画像データは3次元テンソル (x,y,z)座標に対するCT値の組。
スライスで2次元の画像に切り出したものを画像として見る。

In [None]:
# matplotlib.imshow で画像を表示させる
import matplotlib.pyplot as plt

# 2x2のモノクロ画像（グレースケール）を作成
monochrome_image = np.array([[0, 127], [255, 0]], dtype=np.uint8)
# 0　真っ黒、255　真っ白
# モノクロ画像を表示
plt.imshow(monochrome_image, cmap='gray')
plt.axis('off')
plt.show()

In [None]:
# 2x2のカラー画像（RGB）を作成
color_image = np.array([[[255, 0, 0], [0, 255, 0]],
                        [[0, 0, 255], [255, 255, 0]]], dtype=np.uint8)
# [R,G,B]: [255,0,0] は赤、[0,255,0]は緑、[0,0,255]は青、[255,255,0]は黄
# [[赤,緑],[青,黄]] のように色情報を要素に持つ2x2の画像になっている　(2x2x3：3次元テンソル）
# カラー画像を表示
plt.imshow(color_image)
plt.axis('off')
plt.show()

In [None]:
# グレースケール
gradient_image = np.linspace(0, 255, 10, dtype=np.uint8).reshape(1, 10) # ベクトルを1x10の行列に変換
print(gradient_image)
plt.imshow(gradient_image, 'gray')
plt.axis('off')
plt.show()

## 画像の読み込みと表示

In [None]:
img = plt.imread('img/cat.jpg')
plt.imshow(img)
plt.axis('off')
plt.show()

画像を扱うライブラリは他にも多い。
代表的なもの
* [Pillow](https://pypi.org/project/pillow/)
```
from PIL import Image
img = Image.open('img/cat.jpg')
img.show()
```
画像のトリミング、リサイズなど画像処理の機能がある

* [opencv](https://pypi.org/project/opencv-python/)

動画解析（カメラから読み込み）、顔検出などの機能もある

copilotに命令して、WEBカメラから本のバーコード（ISBN）を読み取り、アマゾンの書籍リンクを作って、蔵書リストを作るコードをコピペだけで作れた。（プロンプトエンジニアリング）

## numpy の関数
import numpy as np

* np.linspace(a,b,n) 等差数列を作る（要素の数を指定する）
* np.arange(a,b,dx) 等差数列を作る（幅を指定する）
* np.reshape(A, (h, w)) numpy配列Aの形状を縦h、横wに変更（変更前と変更後で要素数は一致）

In [None]:
A = np.linspace(0, 10, 10)
print(A.shape)
B  = np.reshape(A, (2,5)) # 2行5列に変換
print(B)
C = np.reshape(A, (5,2)) # 5行2列に変換
print(C)