In [None]:
# plt.show()で可視化されない人はこのセルを実行してください。
%matplotlib inline

# 総合添削問題

機械学習における画像認識では、画像データとその画像に紐づけられたラベルの組み合わせが大量に必要となります。しかしながら、機械学習の入力とするには十分な数の画像とラベルの組み合わせを用意する事は、コストがかかるため困難なことであります。
そこで、データの個数を十分量に増やす際に行われるテクニックとして、**画像の水増し**があります。

画像の水増しといっても、ただ単にデータをコピーして量を増やすだけでは意味がありません。<br>
そこで、例えば画像を反転したり、ずらしたりして新たなデータを作り出します。ここでは、主にChapter3で学んだ様々な関数を駆使して画像を水増しする関数を作成してもらいます。

#### 問題

- 画像を受け取ったら5つの方法で加工した画像データを作成し、まとめて配列にして返す関数`scratch_image`関数を作成して下さい。
```python
def scratch_image(img, flip=True, thr=True, filt=True, resize=True, erode=True):
    
    # 水増しの手法を配列にまとめる
    methods = [flip, thr, filt, resize, erode]
    
    """
    flip は画像の左右反転
    thr  は閾値処理
    filt はぼかし
    resizeはモザイク
    erode は収縮
        をするorしないを指定している
        
    imgの型はOpenCVのcv2.read()によって読み込まれた画像データの型
    
    水増しした画像データを配列にまとめて返す
    """
```


- 加工の方法は重ねあわせます。たとえば`flip=True, thr=True, filt=False, resize=False, erode=False`ならば画像の反転と閾値処理を行うので
    1. オリジナルの画像
    2. 左右反転した画像
    3. 閾値処理を行った画像
    4. 左右反転して閾値処理した画像
    
  と、四枚の画像データが配列にまとめられて返されます。
- 全て`True`ならば $2^5 = 32$ 枚の画像データが返されます。
- 作成した`scratch_image`関数を使ってcleansing_dataフォルダ内の画像データ（`cat_sample.png`）を水増しし、`scratch_images`フォルダに保存して下さい。
- 各手法の仕様は以下のようにして下さい。
    1. 反転: 左右で反転
    2. 閾値処理: 閾値100, しきい値より大きい値はそのまま、小さい値は0にする
    3. ぼかし: 自分自身のまわりの$5 \times 5$個のピクセルを用いる
    4. モザイク: 解像度を$1/5$にする
    5. 収縮: 自身を囲む8ピクセルを用いる

<div style="text-align: center;">
    <span style="font-size: 120%">flipとthrのみTrueだった場合の例</span>
</div>
<img src = "https://aidemyexstorage.blob.core.windows.net/aidemycontents/1539254347176308.png	" width="800px">

In [None]:
import os

import numpy as np
import matplotlib.pyplot as plt
import cv2

# 
def scratch_image(img, flip=True, thr=True, filt=True, resize=True, erode=True):
    # 水増しの手法を配列にまとめる
    methods = [flip, thr, filt, resize, erode]
        
    # flip は画像の左右反転
    # thr  は閾値処理
    # filt はぼかし
    # resizeはモザイク
    # erode は縮小
    #     をするorしないを指定している
    # 
    # imgの型はOpenCVのcv2.read()によって読み込まれた画像データの型
    # 
    # 水増しした画像データを配列にまとめて返す
    
    # 画像のサイズを習得、ぼかしに使うフィルターの作成
    img_size = img.shape
    filter1 = np.ones((3, 3))
    # オリジナルの画像データを配列に格納
    images = [img]
    
    
    # ----------------------------ここから書いて下さい----------------------------
    # 手法に用いる関数
    scratch = np.array([
       
        #画像の左右反転のlambda関数を書いてください
        lambda x: 
        
        #閾値処理のlambda関数を書いてください
        lambda x:
        
        #ぼかしのlambda関数を書いてください
        lambda x:
        
        #モザイク処理のlambda関数を書いてください
        lambda x:
        
        #縮小するlambda関数を書いてください
        lambda x:
        
    ])
    
    # 関数と画像を引数に、加工した画像を元と合わせて水増しする関数
    doubling_images = lambda f, imag: (imag + [f(i) for i in imag])
    
    # doubling_imagesを用いてmethodsがTrueの関数で水増ししてください
    for func in scratch[methods]:
        images = 
    
    return images
    
    # ----------------------------ここまで書いて下さい----------------------------


# 画像の読み込み
cat_img = cv2.imread("./cleansing_data/cat_sample.jpg")

# 画像の水増し
scratch_cat_images = scratch_image(cat_img)

# 画像を保存するフォルダーを作成
if not os.path.exists("scratch_images"):
    os.mkdir("scratch_images")

for num, im in enumerate(scratch_cat_images):
    # まず保存先のディレクトリ"scratch_images/"を指定、番号を付けて保存
    cv2.imwrite("scratch_images/" + str(num) + ".jpg" ,im) 

#### ヒント

- まずはChapter3を参考にして`cv2`のメソッドを記述します。その際に必要となるデータ（画像のサイズなど）も用意します。<br>
例えば上下反転する関数は
```python
lambda x: cv2.flip(x, 0)
```
と書けます。これを配列`arr`に入れることで
```python
arr[0](image)
```
と、indexを指定するだけで`arr`中の所定の関数を使うことができます。
- (発展)関数を格納した配列と`flip, thr, filt, resize, erode`を活用して加工に使う関数を取得しましょう。

##  解答例

In [3]:
import os

import numpy as np
import matplotlib.pyplot as plt
import cv2


def scratch_image(img, flip=True, thr=True, filt=True, resize=True, erode=True):
    # 水増しの手法を配列にまとめる
    methods = [flip, thr, filt, resize, erode]
    # 画像のサイズを習得、ぼかしに使うフィルターの作成
    img_size = img.shape
    filter1 = np.ones((3, 3))
    # オリジナルの画像データを配列に格納
    images = [img]
    
    # ----------------------------ここから書いて下さい----------------------------
    # 手法に用いる関数
    scratch = np.array([
        lambda x: cv2.flip(x, 1),
        lambda x: cv2.threshold(x, 100, 255, cv2.THRESH_TOZERO)[1],
        lambda x: cv2.GaussianBlur(x, (5, 5), 0),
        lambda x: cv2.resize(cv2.resize(
                        x, (img_size[1] // 5, img_size[0] // 5)
                    ),(img_size[1], img_size[0])),
        lambda x: cv2.erode(x, filter1)
    ])
    # 関数と画像を引数に、加工した画像を元と合わせて水増しする関数
    
    doubling_images = lambda f, imag: (imag + [f(i) for i in imag])
    # methodsがTrueの関数で水増し
    for func in scratch[methods]:
        images = doubling_images(func, images)
    
    return images
    # ----------------------------ここまで書いて下さい----------------------------

    
# 画像の読み込み
cat_img = cv2.imread("cleansing_data/cat_sample.jpg")

# 画像の水増し
scratch_cat_images = scratch_image(cat_img)

# 画像を保存するフォルダーを作成
if not os.path.exists("scratch_images"):
    os.mkdir("scratch_images")

for num, im in enumerate(scratch_cat_images):
    # まず保存先のディレクトリ"scratch_images/"を指定、番号を付けて保存
    cv2.imwrite("scratch_images/" + str(num) + ".jpg" ,im) 


### 解説

ヒントの通り、加工のメソッドを`scratch`にまとめます。まとめなくても良いですが、可読性を考えて「まとめる」という処理を意識しました。<br>

`doubling_images`では、加工前の画像データを格納した配列`imag`と、メソッド`f`を用いて`imag`を加工した` [f(i) for i in imag]`を連結しています。加工した画像は`imag`中の画像データの数と同じ数できるので、これを連結することで画像データの枚数が倍になっていきます。<br>
また、この関数をループして使うので、オリジナルの画像データもこの関数にあう形にするために、一度`images = [img]`として配列に格納しています。

`scratch[method]`とすることで、`np.array`のブールインデックス参照により`True`の要素を取り出し、`doubling_images`関数に引数として入れることを可能にしています。

どれくらい画像を水増しするかは元の画像がどれほど少ないかにもよりますが、流石にデータ量を32倍にすることはそうそう無いことです。この関数を実装できたならば、水増しの力は十分についたと言えるでしょう。

#### 解説（Appendix）

可読性が非常に悪いのでおすすめしませんが、リスト内包表記を使うことで水増し段階を一行で書くことができます。
```python
# 関数の格納
sc_flip = [
    lambda x: x,  
    lambda x: cv2.flip(x, 1)
]
sc_thr = [
    lambda x: x,
    lambda x: cv2.threshold(x, 100, 255, cv2.THRESH_TOZERO)[1]
]
sc_filter = [
    lambda x: x,
    lambda x: cv2.GaussianBlur(x, (5, 5), 0)
]
sc_mosaic = [
    lambda x: x,
    lambda x: cv2.resize(cv2.resize(
                    x, (img_size[1] // 5, img_size[0] // 5)
                ),(img_size[1], img_size[0]))
]
sc_erode = [
    lambda x: x,
    lambda x: cv2.erode(x, filter1)
]
# 水増し
[e(d(c(b(a(img))))) for a in sc_flip for b in sc_thr for c in sc_filter for d in sc_mosaic for e in sc_erode]
```

`scratch_images`の第三引数に`exp=True/False`を追加し、
- `True`ならば処理は変わらず
- `False`ならば加工を重ねあわせない（つまり、反転したあとに閾値処理をしたりしない。`method`が`True`の部分の加工をする。最大6枚に水増し）

という関数を作成してみるとより実践的です。

### 別解

In [None]:
import sys
import os

import numpy as np
import matplotlib.pyplot as plt
import cv2


def scratch_image(img, flip=True, thr=True, filt=True, resize=True, erode=True):
    # ----------------------------ここから書いて下さい----------------------------
    # 水増しの手法を配列にまとめる
    methods = [flip, thr, filt, resize, erode]
    # 画像のサイズを習得、ぼかしに使うフィルターの作成
    img_size = img.shape
    filter1 = np.ones((3, 3))
    # 手法に用いる関数
    scratch = np.array([
        lambda x: cv2.flip(x, 1),
        lambda x: cv2.threshold(x, 100, 255, cv2.THRESH_TOZERO)[1],
        lambda x: cv2.GaussianBlur(x, (5, 5), 0),
        lambda x: cv2.resize(cv2.resize(
                        x, (img_size[1] // 5, img_size[0] // 5)
                    ),(img_size[1], img_size[0])),
        lambda x: cv2.erode(x, filter1)
    ])
    act_scratch = scratch[methods]
    
    # メソッド準備
    act_num = np.sum([methods])
    form = "0" + str(act_num) + "b"
    cf = np.array([list(format(i, form)) for i in range(2**act_num)])
    
    # 画像変換処理実行
    images = []
    for i in range(2**act_num):
        im = img
        for func in act_scratch[cf[i]=="1"]:  # boolインデックス参照
            im = func(im)
        images.append(im)
    
    return images
    # ----------------------------ここまで書いて下さい----------------------------

    
# 画像の読み込み
cat_img = cv2.imread("./cat_sample.jpg")

# 画像の水増し
scratch_cat_images = scratch_image(cat_img, flip=True, thr=False, filt=True, resize=False, erode=True)

# 画像を保存するフォルダーを作成
if not os.path.exists("scratch_images"):
    os.mkdir("scratch_images")

for num, im in enumerate(scratch_cat_images):
    # まず保存先のディレクトリ"scratch_images/"を指定、番号を付けて保存
    cv2.imwrite("scratch_images/" + str(num) + ".jpg" ,im) 
