<a href="https://colab.research.google.com/github/yousuke0614/hangman/blob/master/ajisaiDataAugmentation.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **データ拡張（Data Augmentation）①**

・元画像：紫陽花10種類（1種類につき2～3枚）、300×300ピクセル

・horizontal flip：画像を水平方向に回転させる（元画像と左右対称の画像ができる）

・vertical flip：画像を垂直方向に回転させる（元画像と上下対称の画像ができる）

1）globモジュールにより、全ての元画像を保存しているディレクトリから全てのファイルパス名を配列として取得する

2）全ての元画像に「水平方向に回転」「垂直方向に回転」の2パターンの画像処理を行う

元画像1枚につき**3パターン**（元画像、水平方向回転、垂直方向回転）へデータ拡張


In [0]:
import os
import numpy as np
from PIL import Image
import glob
import cv2 
from matplotlib import pylab as plt

# フォルダ名「ajisai」の中にある全てのファイルパス名を配列として取得
#files = glob.glob('/content/drive/My Drive/ajisai/001_aihime/*')
files = glob.glob('/content/drive/My Drive/ajisai/*/*')

# horizontal flip
def horizontal_flip(image):
    image =  image[:, ::-1, :]
    return image

# vertical flip
def vertical_flip(image):
    image = image[::-1, :, :]
    return image

# 配列「files」をforで回す
for f in files:
    img = np.array(Image.open(f)) # 画像読み込み(300×300ピクセル)
 
    img_horizontal_flip = horizontal_flip(img) # 画像を水平方向に回転
    img_horizontal_flip = cv2.cvtColor(img_horizontal_flip, cv2.COLOR_RGB2BGR) # RGBからBGRへ変換

    img_vertical_flip = vertical_flip(img) # 画像を垂直方向に回転
    img_vertical_flip = cv2.cvtColor(img_vertical_flip, cv2.COLOR_RGB2BGR)  #RGBからBGRへ変換

    ftitle, fext = os.path.splitext(f) # フォルダ名と拡張子のペアを取得

    # ファイル名に「_hf」「_vf」を付けて、画像を保存する
    cv2.imwrite(ftitle + '_hf' + fext, img_horizontal_flip)
    cv2.imwrite(ftitle + '_vf' + fext, img_vertical_flip)

# **データ拡張（Data Augmentation）②**

・.convert('P')：パレットモードに変換する

・ImageEnhance.Color：彩度を調整する

・ImageEnhance.Contrast：コントラストを調整する

・ImageEnhance.Brightness：明度を調整する

・ImageEnhance.Sharpness：シャープネスを調整する

1）globモジュールにより、全ての元画像 ＋ 2パターンを保存しているディレクトリか
全てのファイルパス名を配列として取得する

2）3パターンの画像に対して、「パレットモードに変換」「彩度・コントラスト・明度・シャープネスのUp・Down」の処理を行う

元画像1枚につき3パターン × 10パターン（変更なし含む）= **30パターン**へデータ拡張

In [0]:
from PIL import ImageEnhance


# フォルダ名「ajisai」の中にある全てのファイルパス名を配列として取得
#files_2 = glob.glob('/content/drive/My Drive/ajisai/001_aihime/*')
files_2 = glob.glob('/content/drive/My Drive/ajisai/*/*')

# 配列「files_2」をforで回す
for f in files_2:
    img_2 = Image.open(f) #画像読み込み(300×300ピクセル)
    
    img_palette = img_2.convert('P') # パレットモードに変換
    img_palette = np.array(img_palette) # 二次元配列＋RGBに変換
    img_palette = cv2.cvtColor(img_palette, cv2.COLOR_RGB2BGR) # RGBからBGRへ変換

    saturation = ImageEnhance.Color(img_2) 
    img_saturation_up = saturation.enhance(1.5) # 彩度をUp
    img_saturation_down = saturation.enhance(0.5) # 彩度をDown
    img_saturation_up = np.array(img_saturation_up) # 二次元配列＋RGBに変換
    img_saturation_down = np.array(img_saturation_down) # 二次元配列＋RGBに変換
    img_saturation_up = cv2.cvtColor(img_saturation_up, cv2.COLOR_RGB2BGR) # RGBからBGRへ変換
    img_saturation_down = cv2.cvtColor(img_saturation_down, cv2.COLOR_RGB2BGR) # RGBからBGRへ変換
   
    contrast = ImageEnhance.Contrast(img_2)
    img_contrast_up = contrast.enhance(1.5) # コントラストをUp
    img_contrast_down = contrast.enhance(0.5) # コントラストをDown
    img_contrast_up = np.array(img_contrast_up) # 二次元配列＋RGBに変換
    img_contrast_down = np.array(img_contrast_down) # 二次元配列＋RGBに変換
    img_contrast_up = cv2.cvtColor(img_contrast_up, cv2.COLOR_RGB2BGR) # RGBからBGRへ変換
    img_contrast_down = cv2.cvtColor(img_contrast_down, cv2.COLOR_RGB2BGR) # RGBからBGRへ変換    

    brightness = ImageEnhance.Brightness(img_2) 
    img_brightness_up = brightness.enhance(1.5) # 明度をUp
    img_brightness_down = brightness.enhance(1.5) # 明度をDown
    img_brightness_up = np.array(img_brightness_up) # 二次元配列＋RGBに変換
    img_brightness_down = np.array(img_brightness_down) # 二次元配列＋RGBに変換
    img_brightness_up = cv2.cvtColor(img_brightness_up, cv2.COLOR_RGB2BGR) # RGBからBGRへ変換
    img_brightness_down = cv2.cvtColor(img_brightness_down, cv2.COLOR_RGB2BGR) # RGBからBGRへ変換

    sharpness = ImageEnhance.Sharpness(img_2)
    img_sharpness_up = sharpness.enhance(1.5) # シャープネスをUp
    img_sharpness_down = sharpness.enhance(0.5) # シャープネスをDown
    img_sharpness_up = np.array(img_sharpness_up) # 二次元配列＋RGBに変換
    img_sharpness_down = np.array(img_sharpness_down) # 二次元配列＋RGBに変換
    img_sharpness_up = cv2.cvtColor(img_sharpness_up, cv2.COLOR_RGB2BGR) # RGBからBGRへ変換
    img_sharpness_down = cv2.cvtColor(img_sharpness_down, cv2.COLOR_RGB2BGR) # RGBからBGRへ変換

    ftitle, fext = os.path.splitext(f) # フォルダ名と拡張子のペアを取得

    # ファイル名に「_pa」「_su」「_sd」「_cu」「_cd」「_bu」「_bd」「_shu」「_shd」を付けて、画像を保存する
    cv2.imwrite(ftitle + '_pa' + fext, img_palette)
    cv2.imwrite(ftitle + '_su' + fext, img_saturation_up)
    cv2.imwrite(ftitle + '_sd' + fext, img_saturation_down)
    cv2.imwrite(ftitle + '_cu' + fext, img_contrast_up)
    cv2.imwrite(ftitle + '_cd' + fext, img_contrast_down)
    cv2.imwrite(ftitle + '_bu' + fext, img_brightness_up)
    cv2.imwrite(ftitle + '_bd' + fext, img_brightness_down)
    cv2.imwrite(ftitle + '_shu' + fext, img_sharpness_up)
    cv2.imwrite(ftitle + '_shd' + fext, img_sharpness_down)

# **データ拡張（Data Augmentation）③**

・cutout：画像の一部にマスクをかける、マスクサイズは100×100ピクセル、マスクの位置は乱数で決める

1）globモジュールにより、10パターンを保存しているディレクトリか
全てのファイルパス名を配列として取得する

2）30パターンの画像に対して、マスク処理（9パターン）を行う

元画像1枚につき30パターン ＋ 30パターン × 9パターン = **300パターン**へデータ拡張

In [0]:
def cutout(image_origin, mask_size):
    # 最後に使うfill()は元の画像を書き換えるので、一旦コピー
    image = np.copy(image_origin)
    mask_value = image.mean()

    h, w, _ = image.shape
    # 乱数でマスク位置のtop, leftを決める
    # はみ出すことを許容し、0以上ではなく負の値もとるようにする(最大mask_size // 2はみ出す)
    top = np.random.randint(0 - mask_size // 2, h - mask_size)
    left = np.random.randint(0 - mask_size // 2, w - mask_size)
    bottom = top + mask_size
    right = left + mask_size

    # はみ出した場合の処理
    if top < 0:
        top = 0
    if left < 0:
        left = 0

    # マスク部分の画素値を平均値で埋める
    image[top:bottom, left:right, :].fill(mask_value)
    return image

# フォルダ名「ajisai」の中にある全てのファイルパス名を配列として取得
#files_3 = glob.glob('/content/drive/My Drive/ajisai/001_aihime/*')
files_3 = glob.glob('/content/drive/My Drive/ajisai/*/*')

# 配列「files_3」をforで回す
for f in files_3:
    img_3 = Image.open(f) #画像読み込み(300×300ピクセル)

    # 100×100、乱数の種:0でrandom_seedを行う
    np.random.seed(0) # 実行するたびに結果が異なるようにならないように乱数の種を固定
    
    i = 1
    # seed0の乱数で9パターンのcutout画像(サイズ120)を生成
    while i <= 9:
        img_cutout = cutout(img_3,120)
        img_cutout = np.array(img_cutout) # 二次元配列＋RGBに変換
        img_cutout = cv2.cvtColor(img_cutout, cv2.COLOR_RGB2BGR) # RGBからBGRへ変換
        
        ftitle, fext = os.path.splitext(f) # フォルダ名と拡張子のペアを取得
        
        # ファイル名に「_cut1-10」を付けて、画像を保存する
        cv2.imwrite(ftitle + '_cut' + str(i) + fext, img_cutout)
        i = i + 1