In [None]:
import cv2
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline
_img = cv2.imread("imori.jpg")
_img = cv2.cvtColor(_img, cv2.COLOR_BGR2RGB)

## Q.31. アフィン変換(スキュー)

(1)アフィン変換を用いて、出力(1)のようなX-sharing(dx = 30)画像を作成せよ。

(2)アフィン変換を用いて、出力2のようなY-sharing(dy = 30)画像を作成せよ。

(3)アフィン変換を用いて、出力3のような幾何変換した(dx = 30, dy = 30)画像を作成せよ。

このような画像はスキュー画像と呼ばれ、画像を斜め方向に伸ばした画像である。

出力(1)の場合、x方向にdxだけ引き伸ばした画像はX-sharingと呼ばれる。

出力(2)の場合、y方向にdyだけ引き伸ばした画像はY-sharingと呼ばれる。

それぞれ次式のアフィン変換で実現できる。
ただし、元画像のサイズがh x wとする。

|(1) X-share| (2) Y-share|
|:---:|:---:|
| <img src="assets/affine_skew_xshare.png" width=200> | <img src="assets/affine_skew_yshare.png" width=200> |

<!--
```bash
(1) X-sharing                  (2) Y-sharing
   a = dx / h                     a = dy / w

  x'       1 a tx    x           x'       1 0 tx    x
[ y' ] = [ 0 1 ty ][ y ]       [ y' ] = [ a 1 ty ][ y ]
  1        0 0  1    1           1        0 0  1    1
```
-->

|入力 (imori.jpg)|出力 (1) (answers_image/answer_31_1.jpg)|出力 (2) (answers_image/answer_31_2.jpg)|出力 (3) (answers_image/answer_31_3.jpg)|
|:---:|:---:|:---:|:---:|
|![](imori.jpg)|![](answers_image/answer_31_1.jpg)|![](answers_image/answer_31_2.jpg)|![](answers_image/answer_31_3.jpg)|

答え 
- Python >> [answers_py/answer_31.py](answers_py/answer_31.py)
- C++ >> [answers_cpp/answer_31.cpp](answers_cpp/answer_31.cpp)

In [None]:
def affine(img, dx=30, dy=30):
    H, W, C = img.shape
    a = 1.
    b = dx / H
    c = dy / W
    d = 1.
    tx = 0.
    ty = 0.

    _img = np.zeros((H+2, W+2, C), dtype=np.float32)
    _img[1:H+1, 1:W+1] = img

    H_new = np.ceil(dy + H).astype(np.int)
    W_new = np.ceil(dx + W).astype(np.int)
    out = np.zeros((H_new, W_new, C), dtype=np.float32)

    x_new = np.tile(np.arange(W_new), (H_new, 1))
    y_new = np.arange(H_new).repeat(W_new).reshape(H_new, -1)

    adbc = a * d - b * c
    x = np.round((d * x_new  - b * y_new) / adbc).astype(np.int) - tx + 1
    y = np.round((-c * x_new + a * y_new) / adbc).astype(np.int) - ty + 1

    x = np.minimum(np.maximum(x, 0), W+1).astype(np.int)
    y = np.minimum(np.maximum(y, 0), H+1).astype(np.int)

    out[y_new, x_new] = _img[y, x]
    out = out.astype(np.uint8)

    return out

In [None]:
fig = plt.figure(figsize=(8, 5))
ax = fig.add_subplot(1, 2, 1)
ax.imshow(_img)
ax = fig.add_subplot(1, 2, 2)
ax.imshow(affine(_img))

## Q.32. フーリエ変換

二次元離散フーリエ変換(DFT)を実装し、*imori.jpg*をグレースケール化したものの周波数のパワースペクトルを表示せよ。
また、逆二次元離散フーリエ変換(IDFT)で画像を復元せよ。

二次元離散フーリエ変換(DFT: Discrete Fourier Transformation)とはフーリエ変換の画像に対する処理方法である。

通常のフーリエ変換はアナログ信号や音声などの連続値かつ一次元を対象に周波数成分を求める計算処理である。

一方、ディジタル画像は[0,255]の離散値をとり、かつ画像はHxWの二次元表示であるので、二次元離散フーリエ変換が行われる。

二次元離散フーリエ変換(DFT)は次式で計算される。

<!--
```bash
K = 0:W, l = 0:H, 入力画像をI として
G(k,l) = Sum_{y=0:H-1, x=0:W-1} I(x,y) exp( -2pi * j * (kx/W + ly/H)) / sqrt(H * W)
```
-->

K = [0, W-1], l = [0, H-1], 入力画像を I として

<img src="assets/dft_equ.png" width="500">

ここでは画像をグレースケール化してから二次元離散フーリエ変換を行え。

パワースペクトルとは Gは複素数で表されるので、Gの絶対値を求めることである。
今回のみ画像表示の時はパワースペクトルは[0,255]にスケーリングせよ。

逆二次元離散フーリエ変換(IDFT: Inverse DFT)とは周波数成分Gから元の画像を復元する手法であり、次式で定義される。

<!--
```bash
x = 0:W, y = 0:H  として
I(x,y) = Sum_{l=0:H-1, k=0:W-1} G(k,l) exp( 2pi * j * (kx/W + ly/H)) / sqrt(H * W)
```
-->
x = [0, W-1], y = [0, H-1] として

<img src="assets/idft_equ.png" width="500" >

上が定義式ですがexp(j)は複素数の値をとってしまうので、実際にコードにするときはぜ下式のように絶対値を使います。

<img src="assets/idft_equ2.png" width="500">

シンプルに全部for文で回すと128^4の計算になるので、時間がかかってしまいます。numpyをうまく活用すれば計算コストを減らすことができます。（解答は128^2まで減らしました。）

|入力 (imori.jpg) |出力 (answers_image/answer_32.jpg)|パワースペクトル (answers_image/answer_32_ps.py)
|:---:|:---:|:---:|
|![](imori.jpg)|![](answers_image/answer_32.jpg)|![](answers_image/answer_32_ps.jpg)|

答え 
- Python >> [answers_py/answer_32.py](answers_py/answer_32.py)
- C++ >> [answers_cpp/answer_32.cpp](answers_cpp/answer_32.cpp)

In [None]:
L, K = 128, 128
M, N = 64, 64
channel = 3
img = np.zeros((64, 64, 3))
for i in range(64):
    for j in range(64):
        img[i, j] = _img[(i*2)%128, (j*2)%128].copy()

In [None]:
def dft(img):
    H, W, _ = img.shape
    G = np.zeros((L, K, channel))
    x = np.tile(np.arange(W), (H, 1))
    y = np.arange(H).repeat(W).reshape(H, -1)

    for l in range(L):
        for k in range(K):
            for c in range(channel):
                G[l, k, c] = np.sum(img[..., c] * np.exp(-2j * np.pi * (x * k / K + y * l / L))) / np.sqrt(K * L)
    
    return G

In [None]:
def idft(G):
    H, W, _ = G.shape
    out = np.zeros((M, N, channel))
    
    x = np.tile(np.arange(W), (H, 1))
    y = np.arange(H).repeat(W).reshape(H, -1)

    for c in range(channel):
        for l in range(M):
            for k in range(N):
                out[l, k, c] = np.abs(np.sum(G[..., c] * np.exp(2j * np.pi * (x * k / W + y * l / H)))) / np.sqrt(W * H)
    out = (out / out.max() * 255)
    out = np.clip(out, 0, 255)
    out = out.astype(np.uint8)

    return out

In [None]:
img = img.astype(np.float32)
G = dft(img)
ps = (np.abs(G) / np.abs(G).max() * 255).astype(np.uint8)
out = idft(G)

In [None]:
fig = plt.figure(figsize=(8, 5))
ax = fig.add_subplot(1, 3, 1)
ax.imshow(img.astype(np.uint8))
ax = fig.add_subplot(1, 3, 2)
ax.imshow(ps.astype(np.uint8))
ax = fig.add_subplot(1, 3, 3)
ax.imshow(out.astype(np.uint8))

## Q.33. フーリエ変換　ローパスフィルタ

*imori.jpg*をグレースケール化したものをDFTし、ローパスフィルタを通してIDFTで画像を復元せよ。

DFTによって得られた周波数成分は左上、右上、左下、右下に近いほど低周波数の成分を含んでいることになり、中心に近いほど高周波成分を示す。

![](assets/lpf.png)

画像における高周波成分とは色が変わっている部分（ノイズや輪郭など）を示し、低周波成分とは色があまり変わっていない部分（夕日のグラデーションなど）を表す。
ここでは、高周波成分をカットし、低周波成分のみを通す**ローパスフィルタ**を実装せよ。

ここでは低周波数の中心から高周波までの距離をrとすると0.5rまでの成分を通すとする。

|入力 (imori.jpg)|出力 (answers_image/answer_33.jpg)|
|:---:|:---:|
|![](imori.jpg)|![](answers_image/answer_33.jpg)|

答え 
- Python >> [answers_py/answer_33.py](answers_py/answer_33.py)
- C++ >> [answers_cpp/answer_33.cpp](answers_cpp/answer_33.cpp)


In [None]:
def lpf(_G, ratio=0.5):
    H, W, C = _G.shape
    tmp = np.zeros_like(_G)
    
    h, w = H//2, W//2
    tmp[:h, :w] = _G[h:, w:]
    tmp[:h, w:] = _G[h:, :w]
    tmp[h:, :w] = _G[:h, w:]
    tmp[h:, w:] = _G[:h, :w]
    
    fil = np.zeros((H, W, C))
    for i in range(H):
        for j in range(W):
            for c in range(C):
                y, x = (i-h)/h, (j-w)/h
                if y**2 + x**2 < 0.5:
                    fil[i, j, c] = 1
    
    tmp = tmp*fil
    G = np.zeros_like(_G)
    G[:h, :w] = tmp[h:, w:]
    G[:h, w:] = tmp[h:, :w]
    G[h:, :w] = tmp[:h, w:]
    G[h:, w:] = tmp[:h, :w]
    
    return G
    
    

In [None]:
img = img.astype(np.float32)
G = dft(img)
G = lpf(G, ratio=0.5)
ps = (np.abs(G) / np.abs(G).max() * 255).astype(np.uint8)
out = idft(G)

In [None]:
fig = plt.figure(figsize=(8, 5))
ax = fig.add_subplot(1, 3, 1)
ax.imshow(img.astype(np.uint8))
ax = fig.add_subplot(1, 3, 2)
ax.imshow(ps.astype(np.uint8))
ax = fig.add_subplot(1, 3, 3)
ax.imshow(out.astype(np.uint8))

## Q.34. フーリエ変換　ハイパスフィルタ

*imori.jpg*をグレースケール化したものをDFTし、ハイパスフィルタを通してIDFTで画像を復元せよ。

ここでは、低周波成分をカットし、高周波成分のみを通す**ハイパスフィルタ**を実装せよ。

ここでは低周波数の中心から高周波までの距離をrとすると0.1rからの成分を通すとする。

|入力 (imori.jpg)|出力 (answers_image/answer_34.jpg)|
|:---:|:---:|
|![](imori.jpg)|![](answers_image/answer_34.jpg)|

答え 
- Python >> [answers_py/answer_34.py](answers_py/answer_34.py)
- C++ >> [answers_cpp/answer_34.cpp](answers_cpp/answer_34.cpp)

In [None]:
def hpf(_G, ratio=0.5):
    H, W, C = _G.shape
    tmp = np.zeros_like(_G)
    
    h, w = H//2, W//2
    tmp[:h, :w] = _G[h:, w:]
    tmp[:h, w:] = _G[h:, :w]
    tmp[h:, :w] = _G[:h, w:]
    tmp[h:, w:] = _G[:h, :w]
    
    fil = np.zeros((H, W, C))
    for i in range(H):
        for j in range(W):
            for c in range(C):
                y, x = (i-h)/h, (j-w)/h
                if y**2 + x**2 >= 0.5:
                    fil[i, j, c] = 1
    
    tmp = tmp*fil
    G = np.zeros_like(_G)
    G[:h, :w] = tmp[h:, w:]
    G[:h, w:] = tmp[h:, :w]
    G[h:, :w] = tmp[:h, w:]
    G[h:, w:] = tmp[:h, :w]
    
    return G

In [None]:
img = img.astype(np.float32)
G = dft(img)
G = hpf(G, ratio=0.5)
ps = (np.abs(G) / np.abs(G).max() * 255).astype(np.uint8)
out = idft(G)

In [None]:
fig = plt.figure(figsize=(8, 5))
ax = fig.add_subplot(1, 3, 1)
ax.imshow(img.astype(np.uint8))
ax = fig.add_subplot(1, 3, 2)
ax.imshow(ps.astype(np.uint8))
ax = fig.add_subplot(1, 3, 3)
ax.imshow(out.astype(np.uint8))