# Python 画像処理

Python による画像処理を学習するためのノートブック

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/RyoWakabayashi/python-learning/blob/main/notebooks/Python%E7%94%BB%E5%83%8F%E5%87%A6%E7%90%86.ipynb)

Python 入門については以下を参照

[ゼロからの Python 入門講座](https://www.python.jp/train/index.html)

## Jupyter 基礎

セルに Python コードを書いて実行すると結果が表示される

In [None]:
1 + 1

In [None]:
"Hello, Jupyter"

In [None]:
x = 1
y = 2

In [None]:
x + y

## The Zen of Python

Python の思想

In [None]:
import this

`!` を先頭につけるとシェルコマンドを実行できる

`pip install` で Python パッケージをインストールできる

In [None]:
!pip install deep_translator

`import` でパッケージを読み込む

In [None]:
from deep_translator import GoogleTranslator

In [None]:
GoogleTranslator(source='auto', target='ja').translate(
"""
The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!
"""
).splitlines()

## Python の配列処理

In [None]:
array = [0, 1, 2, 3, 4, 5]

`[]` で配列内の範囲や位置を指定できる


In [None]:
# `[x]` で x 番目
array[0]

In [None]:
# `[x:]` で x 番目以降
array[2:]

In [None]:
# `[:y]` で y 番目まで
array[:4]

In [None]:
# `[x:y]` で x 番目以降、 y 番目まで
array[1:3]

In [None]:
# `[:]` は全体
array[:]

### 演習１

結果が `[4, 5]` になるよう `array` から特定の範囲を抽出してください

`for` で繰り返し処理ができる

In [None]:
for index in array:
  print(index)

In [None]:
for index in range(10):
  if index % 2 == 0:
    print(index)

## Python の行列演算

Numpy は行列演算を行うためのパッケージ

`import numpy as np` として読み込むと、 `np` で参照できる

In [None]:
import numpy as np

通常の配列を Numpy の配列に変換するには `np.array()` を使う

In [None]:
np_array = np.array(array)

np_array

通常の配列と同様、 `[]` で範囲や位置を指定できる

In [None]:
np_array[2:4]

Numpy では多次元の行列を扱える

In [None]:
np_matrix = np.array([[0, 1, 2], [3, 4, 5], [6, 7, 8]])

np_matrix

`.shape` で行列の形を確認できる

In [None]:
np_matrix.shape

各次元に対して範囲指定ができる

In [None]:
# 2行目
np_matrix[1]

In [None]:
# 2行目、2列目
np_matrix[1][1]

In [None]:
# 2-3行目、1-2列目
np_matrix[1:3, :2]

In [None]:
# 全体
np_matrix[:,:]

指定した範囲の値を変更することができる

In [None]:
np_matrix[2, :2] = [9, 10]

np_matrix

## 演習２

`np_matrix` の 2 行目の 2 列目から 3 列目までの値を 99 に変更してください

## OpenCV による画像生成

Google Colab では OpenCV などのパッケージが既にインストールされている

[OpenCV のチュートリアル](https://docs.opencv.org/4.x/d6/d00/tutorial_py_root.html)

OpenCV は `import cv` で読み込める

In [None]:
import cv2
from IPython.display import display, Image

画像を表示するための関数を用意する

In [None]:
def show(img):
    _, buf = cv2.imencode(".jpg", img)
    display(Image(data=buf.tobytes()))

`np.zeros((<縦>, <横>, 3), np.uint8)` で真っ黒の画像を生成できる

In [None]:
new_image = np.zeros((300, 300, 3), np.uint8)

show(new_image)

`(<縦>, <横>, 3)` の `3` の部分は色情報を表す

色は BGR = Blue Green Red の順番で指定する

それぞれ 0 から 255 の範囲で指定する

In [None]:
# 全体を青にする
new_image[:,:] = [255, 0, 0]

show(new_image)

In [None]:
# 全体を暗い緑にする
new_image[:,:] = [0, 128, 0]

show(new_image)

In [None]:
# 全体を赤にする
new_image[:,:] = [0, 0, 255]

show(new_image)

### 演習３

紫色、黄色を作ってください

行列内の範囲で色や画像内の位置を指定できる

In [None]:
new_image = np.zeros((300, 300, 3), np.uint8)

new_image[:,:,1] = 150

show(new_image)

In [None]:
new_image[:100,:100] = [255, 0, 0]
new_image[:100,200:300] = [0, 255, 0]
new_image[200:300,200:300] = [0, 0, 255]

show(new_image)

### 演習４

画像の中央を白くしてください

## OpenCV による画像加工

Web から画像をダウンロードする

In [None]:
from urllib import request

In [None]:
def download_image(url):
    req = request.urlopen(url)

    array = np.asarray(bytearray(req.read()), dtype=np.uint8)
    return cv2.imdecode(array, cv2.IMREAD_UNCHANGED)

In [None]:
face_image = download_image("https://www.elixirconf.eu/assets/images/ryo-wakabayashi.png")

show(face_image)

画像内の特定の範囲だけを切り抜く

In [None]:
show(face_image[250:350,200:400])

画像内の特定の範囲だけ色を変える

In [None]:
new_face_image = face_image.copy()

new_face_image[250:350,200:400,:] = 0

show(new_face_image)

画像のサイズを変更する

In [None]:
resized_image = cv2.resize(face_image, (800, 200))

show(resized_image)

縮小してから拡大すると、モザイクがかかる

In [None]:
small_image = cv2.resize(face_image, (32, 32), interpolation=cv2.INTER_LINEAR)
show(small_image)

pixelated_image = cv2.resize(small_image, (600, 600), interpolation=cv2.INTER_NEAREST)
show(pixelated_image)

### 演習５

目の周りにだけモザイクをかけてください

### 差分抽出

行列の差を取ると、画像の差分を抽出できる

In [None]:
before_image = download_image("https://camo.qiitausercontent.com/c55169fbe0573e7d468719ff7e5e6f25efa72056/68747470733a2f2f71696974612d696d6167652d73746f72652e73332e61702d6e6f727468656173742d312e616d617a6f6e6177732e636f6d2f302f313438353833352f31323138373463622d336363392d373530632d616631332d3034366136326537306361662e706e67")
show(before_image)
print(before_image.shape)

after_image = download_image("https://camo.qiitausercontent.com/892841eb218de977b432949975d0a13b77252463/68747470733a2f2f71696974612d696d6167652d73746f72652e73332e61702d6e6f727468656173742d312e616d617a6f6e6177732e636f6d2f302f313438353833352f31646334313835622d663637342d326434372d636165322d6364613331626433653039372e706e67")
show(after_image)
print(after_image.shape)

In [None]:
show(after_image[:,:,:3] - before_image)

### 画像の並進、回転

画像の並進、回転にはアフィン変換を利用する

In [None]:
(height, width, _) = face_image.shape

(height, width)

In [None]:
dx, dy = 200, 100

afin_matrix = np.array(
    [[1, 0, dx],
     [0, 1, dy]],
    np.float32
)

moved_image = cv2.warpAffine(face_image, afin_matrix, (width, height))

show(moved_image)

In [None]:
digree = 30

afin_matrix = cv2.getRotationMatrix2D((width/2, height/2), digree, 1)

rotated_image = cv2.warpAffine(face_image, afin_matrix, (width, height))

show(rotated_image)

### 演習６

画像を45度回転して上に 100px 左に 200px 動かしてください

### 図形、文字列の描画

In [None]:
drawed_image = face_image.copy()

cv2.rectangle(drawed_image,
    (200, 100),  # 左上の座標
    (300, 400),  # 右下の座標
    (0, 0, 255), # 色
    thickness=8  # 太さ
)

cv2.ellipse(drawed_image,
    ((300, 200), (100, 50), 45),  # 中心座標、長径と短径、回転角度
    (0, 255, 0),  # 色
    thickness=5   # 太さ
)

cv2.putText(drawed_image,
    'Hello!',                 # 描画する文字列
    (250, 150),               # 文字列を描画する座標
    cv2.FONT_HERSHEY_SIMPLEX, # フォント
    2.0,                      # 文字の大きさ
    (255, 0, 0),              # 色
    thickness=4               # 太さ
)

show(drawed_image)

### 類似画像検索

画像のハッシュを使うことで、画像間の類似度を計算できる

In [None]:
# 元画像
image_a = face_image.copy()

# 縮小
image_b = cv2.resize(face_image, (300, 300))

# 平行移動
image_c = cv2.warpAffine(face_image, np.array([[1, 0, 30],[0, 1, 20]], np.float32), (width, height))

# 回転
image_d = cv2.warpAffine(face_image, np.array(cv2.getRotationMatrix2D((width/2, height/2), 5, 1), np.float32), (width, height))

# 四角形の描画
image_e = cv2.rectangle(face_image.copy(), (200, 100), (300, 400), (0, 0, 255), thickness=8)

# 別の画像
image_f = cv2.resize(download_image("https://www.elixirconf.eu/assets/images/susumu-yamazaki.jpg"), (600, 600))

show(image_a)
show(image_b)
show(image_c)
show(image_d)
show(image_e)
show(image_f)

#### PHash

In [None]:
hash_func = cv2.img_hash.PHash_create()

phash_a = hash_func.compute(image_a)
phash_b = hash_func.compute(image_b)
phash_c = hash_func.compute(image_c)
phash_d = hash_func.compute(image_d)
phash_e = hash_func.compute(image_e)
phash_f = hash_func.compute(image_f)

print([phash_a, phash_b, phash_c, phash_d, phash_e, phash_f])

In [None]:
print(hash_func.compare(phash_a, phash_a))
print(hash_func.compare(phash_a, phash_b))
print(hash_func.compare(phash_a, phash_c))
print(hash_func.compare(phash_a, phash_d))
print(hash_func.compare(phash_a, phash_e))
print(hash_func.compare(phash_a, phash_f))

#### AHash

In [None]:
hash_func = cv2.img_hash.AverageHash_create()

ahash_a = hash_func.compute(image_a)
ahash_b = hash_func.compute(image_b)
ahash_c = hash_func.compute(image_c)
ahash_d = hash_func.compute(image_d)
ahash_e = hash_func.compute(image_e)
ahash_f = hash_func.compute(image_f)

print(hash_func.compare(ahash_a, ahash_a))
print(hash_func.compare(ahash_a, ahash_b))
print(hash_func.compare(ahash_a, ahash_c))
print(hash_func.compare(ahash_a, ahash_d))
print(hash_func.compare(ahash_a, ahash_e))
print(hash_func.compare(ahash_a, ahash_f))

#### BHash

In [None]:
hash_func = cv2.img_hash.BlockMeanHash_create()

bhash_a = hash_func.compute(image_a)
bhash_b = hash_func.compute(image_b)
bhash_c = hash_func.compute(image_c)
bhash_d = hash_func.compute(image_d)
bhash_e = hash_func.compute(image_e)
bhash_f = hash_func.compute(image_f)

print(hash_func.compare(bhash_a, bhash_a))
print(hash_func.compare(bhash_a, bhash_b))
print(hash_func.compare(bhash_a, bhash_c))
print(hash_func.compare(bhash_a, bhash_d))
print(hash_func.compare(bhash_a, bhash_e))
print(hash_func.compare(bhash_a, bhash_f))

## OpenCV による動画処理

In [None]:
!wget -O sample.mp4 "https://oec-dx.net/pickture/img/video/pickture.mp4"

In [None]:
capture = cv2.VideoCapture("sample.mp4")

width = int(capture.get(cv2.CAP_PROP_FRAME_WIDTH))
height = int(capture.get(cv2.CAP_PROP_FRAME_HEIGHT))
print((width, height))

動画は静止画の連続

In [None]:
frame_count = int(capture.get(cv2.CAP_PROP_FRAME_COUNT))
print(frame_count)

フレームレート(FPS) = 1秒間に何枚の静止画を含んでいるか

In [None]:
frame_rate = int(capture.get(cv2.CAP_PROP_FPS))
print(frame_rate)

In [None]:
ret, frame = capture.read()

print(ret)
show(cv2.resize(frame, (384, 216)))

for _ in range(10):
    for _ in range(frame_rate * 10):
        _, frame = capture.read()
        show(cv2.resize(frame, (384, 216)))

In [None]:
capture.set(cv2.CAP_PROP_POS_FRAMES, 0)

format = cv2.VideoWriter_fourcc('m', 'p', '4', 'v')
writer = cv2.VideoWriter('./output.mp4', format, frame_rate, (width, height))

for index in range(60):
    _, frame = capture.read()
    frame = cv2.warpAffine(frame, np.array([[1, 0, index * 10],[0, 1, 0]], np.float32), (width, height))
    writer.write(frame)

capture.release()
writer.release()

### 演習７

動画を徐々に回転するよう加工してください