<a href="https://colab.research.google.com/github/takatakamanbou/ML/blob/2023/omake06.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# ML omake06

<img width=64 src="https://www-tlab.math.ryukoku.ac.jp/~takataka/course/ML/ML-logo.png">


----
# 主成分分析の画像データ圧縮への応用
----

omake05 では，$K$-平均法を用いて画像データを圧縮してみました．ここでは，
主成分分析を使って同様のことをやってみましょう．
omake05 と同様に，画像の小さな領域をひとまとめにしてベクトルデータとして扱います．
例えば，画像を縦横8画素の小さいブロックに分割する場合，$8\times 8 \times 3 = 192$ 次元のデータを扱うことになります．
どんな結果が得られるか，やってみましょう．

---
## 準備

画像をブロックに分割したりする処理は，こちらで用意した関数使って楽をしてもらうことにします．

In [None]:
# 準備あれこれ
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn
seaborn.set()

# コンピュータビジョンライブラリ OpenCV
import cv2

In [None]:
# Colab へのファイルアップロードを実行する関数
#
def uploadToColab():
    try:
        from google.colab import files
        rv = files.upload()
    except:
        print('このコードは Colab 以外の環境では実行できないよ．')


In [None]:
# OpenCVの形式の画像を表示する関数
#
def imshow(img):
    try:
        from google.colab.patches import cv2_imshow
        cv2_imshow(img) # Colab上で実行している場合
    except:
        cv2.imshow(img)  # それ以外の場合

In [None]:
### 画像を bsize x bsize のブロックに分割する関数
#
def image2blocks(img, bsize):

    assert img.ndim == 3 and img.shape[2] == 3, 'img の shape がおかしい？？'

    # 画像サイズが bsize の整数倍になるよう端を切り捨てる
    h, w = img.shape[:2]
    ny, nx = h//bsize, w//bsize
    h2, w2 = ny*bsize, nx*bsize
    img2 = img[:h2, :w2]

    # ブロック切り出し
    blocks = np.empty((ny, nx, bsize*bsize*3), dtype=img2.dtype)
    for iy in range(ny):
        for ix in range(nx):
            blocks[iy, ix, :] = img2[iy*bsize:(iy+1)*bsize, ix*bsize:(ix+1)*bsize, :].reshape(-1)

    return blocks


In [None]:
### ブロックから画像を復元する関数
#
def blocks2image(blocks, bsize):

    assert blocks.ndim == 3 and blocks.shape[2] == bsize*bsize*3, 'blocks の shape がおかしい？'

    ny, nx = blocks.shape[:2]
    img = np.empty((ny*bsize, nx*bsize, 3), dtype=blocks.dtype)

    # ブロックから画像へ
    for iy in range(ny):
        for ix in range(nx):
            img[iy*bsize:(iy+1)*bsize, ix*bsize:(ix+1)*bsize, :] = blocks[iy, ix, :].reshape((bsize, bsize, -1))

    return img


In [None]:
#####  固有ベクトルを可視化する関数
#
def displayEigenVectors(ax, evec, nx, ny, bsize, gap=1):

    assert evec.ndim == 2 and evec.shape[1] == bsize*bsize*3

    # 並べた画像の幅と高さ
    width  = nx * (bsize + gap) + gap
    height = ny * (bsize + gap) + gap

    # 正負の値を [0, 255] にする
    tmp = np.zeros((nx*ny, bsize*bsize*3))
    for h in range(nx*ny):
        tmp[h, :] = evec[h, :]
    absmax = np.max(np.abs(tmp))
    tmp = tmp/absmax*127 + 128

    # 画像の作成
    img = np.zeros((height, width, 3), dtype=np.uint8) + 128
    for iy in range(ny):
        lty = iy*(bsize + gap) + gap
        for ix in range(nx):
            if iy*nx+ix >= tmp.shape[0]:
                break
            ltx = ix*(bsize + gap) + gap
            img[lty:lty+bsize, ltx:ltx+bsize, :] = tmp[iy*nx+ix, :].reshape((bsize, bsize, 3))

    # OpenCV 形式（画素値がBGRの順）から matplotlib 形式(RGB) への変換
    img2 = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

    # 表示
    ax.axis('off')
    ax.imshow(img2)

---
## 実験0

上記の関数の使い方を理解するために，簡単な実験を．

In [None]:
# お試し用画像
! wget -nc https://www-tlab.math.ryukoku.ac.jp/~takataka/course/ML/uni3.png

In [None]:
# 画像を読み込んで表示
img = cv2.imread('uni3.png')
assert img.ndim == 3 and img.shape[2] == 3 # 3チャンネルカラー画像のみ扱えます
imshow(img)

In [None]:
print('img.shape:', img.shape)

# bsize x bsize にブロック分割
bsize = 8
X = image2blocks(img, bsize)
print('X.shape:', X.shape)

# データ数 x 次元数 の2次元配列に reshape しデータ型を float に
XX = X.reshape((-1, bsize*bsize*3)).astype(float)
print('XX.shape:', XX.shape)
N, D = XX.shape

# XX と同じ形，型の配列つくる
ZZ = np.empty_like(XX)
print('ZZ.shape:', ZZ.shape)

# XX の行ごとに列方向の平均値をもとめてそれを ZZ の同じ場所に代入
for n in range(XX.shape[0]):
    ZZ[n, :] = np.mean(XX[n, :])

# ZZ を X と同じ shape にする
Z = ZZ.reshape(X.shape)
print('Z.shape:', Z.shape)

# Z を画像の形に
imgZ = blocks2image(Z, bsize)
print('imgZ.shape:', imgZ.shape)

# 画像として表示
imshow(imgZ)

上のコードセルを実行すると，$8\times 8$ のブロックごとにその中の画素値の平均を求め，それをブロック内のすべての位置に代入した画像が得られます．RGB全てに同じ値が代入されるので，グレイスケール画像に見えるはずです．

`img`, `X`, `XX` 等の shape がどうなっているか確かめて，何をやっているのか理解しましょう．

---
## 実験1

上記の関数たちを利用して，自分で用意した画像を $8\times 8$ ブロックで $K$-means クラスタリングし，各ブロックを対応するセントロイドに置き換えた画像を作る実験をしましょう．



In [None]:
# Colab へファイルをアップロード
uploadToColab()

# ls コマンドでファイルを一覧
! ls

In [None]:
# 画像を読み込む．`uni3.png` を自分がアップロードしたファイルの名前に修正
img = cv2.imread('uni3.png')
assert img.ndim == 3 and img.shape[2] == 3 # 3チャンネルカラー画像のみ扱えます
imshow(img)
print('img.shape:', img.shape)

以下にコードを書きましょう．

実験0のコードの `# XX の行ごとに列方向の平均値をもとめてそれを YY の同じ場所に代入` の部分を書き換えて，次のような処理をさせることになります．

1. `XX` を学習データとして K-means クラスタリングの学習を行う
1. セントロイドを得る
1. `XX` の行ごとにラベル（セントロイドの番号）を得る
1. `YY` の各行に対応するセントロイドの値を代入する

K-means クラスタリングは，機械学習ライブラリ [scikit-learn](https://scikit-learn.org/) の [sklearn.cluster.KMeans](https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html) を使ってやるのがよいでしょう．
画像の減色のコードも参考にしたらよいかもしれません．

In [None]:
# bsize x bsize にブロック分割
bsize = 8
X = image2blocks(img, bsize)
print('X.shape:', X.shape)

# データ数 x 次元数 の2次元配列に reshape しデータ型を float に
XX = X.reshape((-1, bsize*bsize*3)).astype(float)
print('XX.shape:', XX.shape)
N, D = XX.shape

# 平均をゼロベクトルにする
Xm = np.mean(XX, axis=0)
XX -= Xm[np.newaxis, :]

# XX の分散共分散行列の固有値と固有ベクトルを求める（特異値分解を使って）
_, sval, evec = np.linalg.svd(XX, full_matrices=False)
eval = sval**2/N
print('evec.shape:', evec.shape)

# evec[0, :] が最大の固有値に対応する固有ベクトル，evec[1, :] が2番目の固有値に対応する固有ベクトル...


##### この部分に，evec を使って XX をH次元に変換して再構成したものを ZZ に代入するコードを書く
H = 10 # 次元削減後の次元数
ZZ = np.empty_like(XX)



##### 以下の3行は削除することになる #####
# XX の行ごとに列方向の平均値をもとめてそれを ZZ の同じ場所に代入
for n in range(N):
    ZZ[n, :] = np.mean(XX[n, :]) + Xm

# ZZ を X と同じ shape にする
Z = ZZ.reshape(X.shape)
print('Z.shape:', Z.shape)

# Z を画像の形に
imgZ = blocks2image(Z, bsize)
print('imgZ.shape:', imgZ.shape)

# 画像として表示
imshow(imgZ)

固有ベクトルが `evec` という名前で `(主成分の番号, データ次元数)` という shape をもつ2次元配列に格納されているときに次のコードセルを実行すると，固有ベクトルの値を可視化することができます．

In [None]:
fig, ax = plt.subplots(figsize=(8, 8))
displayEigenVectors(ax, evec, 8, 8, bsize, gap=1)
plt.show()