### Data Augmentation, 데이터 증강
- 이미지의 종류와 개수가 적으면, CNN 모델의 성능이 떨어질 수 밖에 없다. 또한, 몇 안 되는 이미지로 훈련시키면 과적합이 발생한다.
=트레이닝 데이터에 과하게 fit이 되기 때문에...
- CNN 모델의 성능을 높이고 과적합을 개선하기 위해서는 이미지의 종류와 개수가 많아야 한다. 즉, 데이터의 양을 늘려야 한다.
- 이미지 데이터는 학습 데이터를 수집하여 양을 늘리기 쉽지 않기 때문에, 원본 이미지를 변형시켜서 양을 늘릴 수 있다.
- Data Augmentation을 통해 원본 이미지에 다양한 번형을 주어서 학습 이미지 데이터를 늘리는 것과 유사한 효과를 볼 수 있다.
- 원본 학습 이미지의 개수를 늘리는 것이 아닌 매 학습 마다 개별 원본 이미지를 변형해서 학습을 수행한다.
= 100장이 수억개가 되는게 아니라 효과를 주어서 진행.... 이미지 용ㅇ량이 느는게 아님

<img src='./images/data_augmentation.png' width='400' style='margin-left: 30px'>

#### 공간 레벨 변형
- 좌우 또는 상하 반전, 특정 영역만큼 확대, 축소, 회전 등으로 변형시킨다.

<img src='./images/spatial.png' width='500px'>

#### 픽셀 레벨 변형
- 밝기, 명암, 채도, 색상 등을 변형시킨다.

<img src='./images/pixel.png' width='500px' style='margin-left: 10px'>

In [1]:
# with문으로 파일을 열고 f로 할당
with open('./datasets/animals/translate.py') as f:
    # 파일을 내용을 읽어와 content에 저장
    content = f.readline()
    # 중괄호 사이의 문장을 찾아서 가져오고
    # eval을 사용하여 문자열 안에 갇혀있는 문장을 실제 딕셔너리로 변환
    contents1 = eval(content[content.index('{'):content.index('}') + 1])
    # 키와 값을 반대로 변경하여 저장
    contents2 = {v : k for k, v in contents1.items()}

print(contents1, contents2, sep='\n')

{'cane': 'dog', 'cavallo': 'horse', 'elefante': 'elephant', 'farfalla': 'butterfly', 'gallina': 'chicken', 'gatto': 'cat', 'mucca': 'cow', 'pecora': 'sheep', 'scoiattolo': 'squirrel', 'dog': 'cane', 'elephant': 'elefante', 'butterfly': 'farfalla', 'chicken': 'gallina', 'cat': 'gatto', 'cow': 'mucca', 'spider': 'ragno', 'squirrel': 'scoiattolo'}
{'dog': 'cane', 'horse': 'cavallo', 'elephant': 'elefante', 'butterfly': 'farfalla', 'chicken': 'gallina', 'cat': 'gatto', 'cow': 'mucca', 'sheep': 'pecora', 'squirrel': 'scoiattolo', 'cane': 'dog', 'elefante': 'elephant', 'farfalla': 'butterfly', 'gallina': 'chicken', 'gatto': 'cat', 'mucca': 'cow', 'ragno': 'spider', 'scoiattolo': 'squirrel'}


In [2]:
from glob import glob
import os

# 이미지가 저장되어 있는 경로 지정
root = './datasets/animals/original/'

# 해당 경로를 통해 이미지 폴더를 찾아옴
# glob: 파일 경로와 이름 패턴을 사용하여 파일을 찾을 수 있게 해주는 모듈
# *: 모든 문자열을 대체
directories = glob(os.path.join(root, '*'))

# 원래 정방향인데 에러나면 역방향으로 찾음
for directory in directories:
    try:
        # 디렉터리 이름을 해당하는 번역된 이름으로 변경
        os.rename(directory, os.path.join(root, contents1[directory[directory.rindex('\\') + 1:]]))
    except KeyError as e:
        # KeyError가 발생하면 번역된 이름이 아닌 원래 이름으로 변경
        os.rename(directory, os.path.join(root, contents2[directory[directory.rindex('\\') + 1:]]))

In [3]:
# 이미지가 저장되어 있는 경로 지정
root = './datasets/animals/original/'

# 해당 경로를 통해 이미지 폴더를 찾아옴
directories = glob(os.path.join(root, '*'))
# 폴더 이름 저장할 초기 list 생성
directory_names = []

for directory in directories:
    # 디렉토리의 이름을 찾아와서 list에 저장
    # rindex: 문자열에서 특정 문자 또는 부분 문자열의 마지막으로 발생하는 인덱스를 반환하는 메서드
    directory_names.append(directory[directory.rindex('\\') + 1:])

print(directory_names)

['butterfly', 'cat', 'chicken', 'cow', 'dog', 'elephant', 'horse', 'sheep', 'spider', 'squirrel']


In [4]:
# 이미지가 저장되어 있는 경로 지정
root = './datasets/animals/original/'

# 이미지 별 폴더 안 이미지들의 파일명 변경
for name in directory_names:
    # os.listdir(): 지정된 디렉토리 내의 파일 목록 가져오기
    # enumerate(): 함수를 사용하여 파일 목록에서 파일 이름과 해당 파일의 인덱스를 반환
    for i, file_name in enumerate(os.listdir(os.path.join(root, name))):
        # 이전 파일의 전체 경로
        old_file = os.path.join(root + name + '/', file_name)
        # 신규 파일 전체 경로 작성
        new_file = os.path.join(root + name + '/', name + str(i + 1) + '.png')

        # 이전 파일의 이름을 신규 파일로 변경
        os.rename(old_file, new_file)

In [5]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# 경로 지정
root = './datasets/animals/original/'

# 이미지의 픽셀 값을 0에서 255 사이에서 0에서 1 사이의 값으로 조정
# ImageDataGenerator: 이미지 데이터를 증강하고 전처리하는 데 사용되는 클래스
idg = ImageDataGenerator(rescale=1./255)

# 디렉토리에서 이미지를 가져와 배치로 변환
# flow_from_directory(): 디렉토리를 통해서 가져옴
idg.flow_from_directory(
    root,
    targets_size=(250, 250),
    # 한번에 가져오면 하드웨어에 무리가가기 때문에 나눠서 가져오기
    batch_size=32,
    class_mode='categorical'
)

print(generator.class_indices)

TypeError: ImageDataGenerator.flow_from_directory() got an unexpected keyword argument 'targets_size'

In [None]:
# # cv2로 변환된 파일 불러오기 위해 opencv-python 설치
# pip install opencv-python

In [None]:
import cv2
import matplotlib.pyplot as plt

# 이미지 경로는 generator가 가지고 있음

# # 이미지 읽어오기
# cv2.imread(경로)

# 형변환
cv2.cvtColor(cv2.imread(generator.filepaths[3000]), cv2.COLOR_BGR2RGB)

def show_image(image):
    plt.figure(figsize=(4, 4))
    plt.imshow(image)
    # 옆에 꺼주기
    plt.axis('off')


show_image(image)

In [None]:
import numpy as np
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# Horizontal Filp: 좌우반전 적용
# 적용하더라도 반드시 변환되지 않고 특정 확률로 랜덤하게 적용된다.
# ImageDataGenerator 가져오는 것만이 목적이 아님...
# horizontal_flip 수평으로 반전시킴
idg = ImageDataGenerator(horizontal_flip=True)

# ImageDataGenerator는 배치 사이즈를 포함한 4차원으로 연산되기 때문에
# 기존 image를 한 차원 증가시켜 준다.
# 차원 증가
# 차원을 맞춰서 넣어야함, 직므 3차원인데 4차원으로 증가 필요 (배치가 붙어있으면 4차원)
image_batch = np.expand_dims(image, axis=0)

# 4차원 이미지(배치 사이즈 포함)를 fit에 전달한다.
idg.fit(image_batch)
# fit한 뒤 flow에 다시 넣어준다.
#fit에서 flow로 가져와진게 데이터 제너레이터가 됨 (핏 트랜스폼이랑 같음)
data_generator = idg.flow(image_batch)

# 적용된 이미지를 next로 가져온다.
aug_image_batch = next(data_genrator)

# 이미지를 시각화하기 위해서 한 차원 감소시킨 3차원으로 변경해 준다.
# 어그먼테이션을 적용하려면 삼차원에서 사처원
# 핏하고 플로우함 근데 도 이미지 쇼 하려면 3차원으로 바꿔야함 그래서 스퀴즈를씀
aug_image = np.squeeze(aug_image_batch)

# 실수에서 정수로 변경 후 출력해 준다.
# 현재 소 수점이라 정수로 변경하여 출력
show_image(aug_image.astype('int'))

# 근데 하다보면 좌우반전이 안되다가 할 수도 있는데 이유가 확률적임, 랜덤하게 적용된다.

In [None]:
N_IMAGES = 4
fig, axs = plt.subplots(1, N_IMAGES, figsize=(22, 8))

for i in range(N_IMAGES):
    aug_image_batch = next(data_generator)
    aug_image = np.squeeze(aug_image_batch)
    aug_image = aug_image.astype('int')
    axs[i].imshow(aug_image)
    axs[i].axis('off')

In [None]:
def show_aug_image_batch(image, idg, n_imagaes=4, to_int=True):
    image_batch = np.expand_dims(image, axis=0)
    idg.fit(image_batch)
    data_generator = idg.flow(image_batch)

    fig, axs = plt.subplots(1, n_images, figsize=(n_images * 5, 8))

    for i in range(N_IMAGES):
        aug_image_batch = next(data_generator)
        aug_image = np.squeeze(aug_image_batch)
        if to_int:
            aug_image = aug_image.astype('int')
            
        axs[i].imshow(aug_image)
        axs[i].axis('off')

In [None]:
# 좌우 반전
idg = ImaageDataGenerator(horizontal_flip=True)
show_aug_image_batch(image, idg)

# Vertical filp: 상하반전 적용
idg = ImaageDataGenerator(vertical_flip=True)
show_aug_image_batch(image, idg)

# 상하, 좌우 반전
idg = ImaageDataGenerator(horizontal_flip=True, vertical_flip=True)
show_aug_image_batch(image, idg)

In [None]:
# Rotation_range: 회전(0 ~ n)
idg = ImaageDataGenerator(rotation_range=45)
show_aug_image_batch(image, idg)

idg = ImaageDataGenerator(rotation_range=45, horizontal_flip=True, vertical_flip=True)
show_aug_image_batch(image, idg)

In [None]:
# 가까운 가장자리를 늘려서 이동시킴
idg = ImaageDataGenerator(width_shift_range=0.4)
show_aug_image_batch(image, idg)

idg = ImaageDataGenerator(height_shift_range=0.4)
show_aug_image_batch(image, idg)

In [None]:
idg = ImaageDataGenerator(rotation_range=45, horizontal_flip=True, vertical_flip=True, width_shift_range=0.4, height_shift_range=0.4)
show_aug_image_batch(image, idg)

In [None]:
# 빈 공간을 가장 가까운 곳의 픽셀 값으로 채움 (디폴트)
idg = ImaageDataGenerator(width_shift_range=0.4, fill_mode='nearest')
show_aug_image_batch(image, idg)

# 빈 공간을 해당 영역 근처 공간으로 채움
idg = ImaageDataGenerator(width_shift_range=0.4, fill_mode='reflect')
show_aug_image_batch(image, idg)

# 빈 공간을 잘려나간 이미지로 채움
idg = ImaageDataGenerator(width_shift_range=0.4, fill_mode='wrap')
show_aug_image_batch(image, idg)


# 특정 픽셀값으로 채움
# fill_mode='constant'상수로 받는다, cval=41 컬러색상
idg = ImaageDataGenerator(width_shift_range=0.4, fill_mode='constant', cval=45)
show_aug_image_batch(image, idg)

In [None]:
# Zoom in: 확대
idg = ImaageDataGenerator(zoom_range=[0.5, 0.9])
show_aug_image_batch(image, idg)

# Zoom out: 축소
idg = ImaageDataGenerator(zoom_range=[1.1, 1.5], fill_mode='constant', cval=45))
show_aug_image_batch(image, idg)

# 1보다 작으면 확대, 1보다 크면 축소
idg = ImaageDataGenerator(zoom_range=[0.5, 1.5], fill_mode='constant', cval=45))
show_aug_image_batch(image, idg)


In [None]:
# Shear: 늘리기 (0 ~ n)
idg = ImaageDataGenerator(shear_range=45)
show_aug_image_batch(image, idg)

In [None]:
# Brightness: 밝기 조절
# 1보다 작으면 어두워짐, 1보다 크면 밝아짐
idg = ImaageDataGenerator(brightness_range=(0.1, 0.9))
show_aug_image_batch(image, idg)

idg = ImaageDataGenerator(brightness_range=(1.1, 1.5))
show_aug_image_batch(image, idg)

In [None]:
# Channel Shift: 채널 변경 
# RGB 채널을 임의의 값으로 변경
idg = ImaageDataGenerator(channel_shift_range=150)
show_aug_image_batch(image, idg)

In [None]:
# 리스케일 보기에는 다 검은색으로 나오지만 해줘야함!

#### albumentations

In [None]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator

root = './datasets/animals/original/'

idg = ImageDataGenerator(rescale=1./255)
generator = idg.flow_from_directory(
    root,
    target_size=(250, 250),
    batch_size=32,
    class_mode='categorical'
)

print(generator.class_indices)

In [None]:
import cv2
import matplotlib.pyplot as plt

# 형변환
cv2.cvtColor(cv2.imread(generator.filepaths[407]), cv2.COLOR_BGR2RGB)

def show_image(image):
    plt.figure(figsize=(4, 4))
    plt.imshow(image)
    # 옆에 꺼주기
    plt.axis('off')


show_image(image)

In [None]:
# # cmd 창에서 albumentations 설치
# conda install -c conda-forge albumentations

In [None]:
def show_images(images, targets, ncols=4, title=None):
    figure, axs = plt.subplots(figsize=(ncols * 5, 4), nrows=1, ncols=ncols)
    for i in range(ncols):
        axs[i].imshow(images[i])
        axs[i].set_title(targets[i])

def prepeat_aug(original_image=None, aug_image=None, target=None, aug=None, ncols=2):
    image_list = [original_image]
    target_list = ['Original']

    original_image = aug(image=original_image)['image']
    image_list.append(aug_image)
    target_list.append(target)
    
    show_images(image_list, target_list, ncols)

In [6]:
import albumentations as A
# 확률 작성 가능 1하면 무조건 됨
# call 함수로 되어 있어서 이미지를 넣으면 됨!
aug = A.HorizontalFlip(p=0.5)
# # dict으로 되어 있기 때문에 ['image'] 이렇게 바로 불러올 수 있음
# aug(image=image)['image']

repeat_aug(original_image=image, aug_image=aug_image, target='HorizontalFlip', aug=aug)

ModuleNotFoundError: No module named 'albumentations'

In [None]:
aug = A.VerticalFlip(p=0.5)

repeat_aug(original_image=image, aug_image=aug_image, target='VerticalFlip', aug=aug)

In [None]:
# limit=90 일 경우 -90 ~ 90 범위를 갖는다.
# 거울처럼 반사
aug = A.Rotate(p=0.5, limit=90, border_mode=cv2.BORDER_REFLECT)
# 잘린부분으로 채우기
aug = A.Rotate(p=0.5, limit=90, border_mode=cv2.BORDER_WRAP)
# 검은색으로 채우기(훈련 시  검은색으로 하기)
aug = A.Rotate(p=0.5, limit=90, border_mode=cv2.BORDER_CONSTANT)

repeat_aug(original_image=image, aug_image=aug_image, target='Rotate', aug=aug)

In [None]:
# 랜덤한 값으로 회전함
aug = A.RandomRotate90(p=0.5)

repeat_aug(original_image=image, aug_image=aug_image, target='RandomRotate90', aug=aug)

In [None]:
# shift와 scale(zoom), rotate를 함께 또는 별개로 적용, 별개로 적용할 경우 나머지 0으로 설정
# shift_limit/scale_limit=0.5=(-0.5, 0.5)
aug = A.ShiftScaleRotate(p=0.5, shift_limit=0, scale_limit=0.5, border_mode=cv2.BORDER_CONSTANT, rotate_limit=90)

repeat_aug(original_image=image, aug_image=aug_image, target='RandomRotate90', aug=aug)

In [None]:
def show_images(images, targets, ncols=4, title=None):
    figure, axs = plt.subplots(figsize=(ncols * 5, 4), nrows=1, ncols=ncols)
    for i in range(ncols):
        axs[i].imshow(images[i])
        axs[i].set_title(targets[i])

def prepeat_aug(original_image=None, aug_image=None, target=None, aug=None, ncols=2):
    image_list = [original_image]
    target_list = ['Original']

    for i in range(ncols + 1):
        original_image = aug(image=original_image)['image']
        image_list.append(aug_image)
        target_list.append(target)
    
    show_images(image_list, target_list, ncols)

In [None]:
aug = A.ShiftScaleRotate(p=0.5, shift_limit=0, scale_limit=0.5, border_mode=cv2.BORDER_CONSTANT, rotate_limit=90)

repeat_aug(original_image=image, aug_image=aug_image, target='RandomRotate90', aug=aug, ncols=5)

In [None]:
# 생성자에 list로 전달
A.Compose([
    A.VerticalFlip(p=0.5),
    A.HorizontalFlip(p=0.5),
])

In [None]:
image.shape

In [None]:
# 특정 영역을 잘라낸 후 원본 사이즈로 다시 Resize하지 않음
# x: width, y:height, max 값은 이미지 크기로 설정해야 한다.
# 범위가 아닌 지정한 부분을 제외한 나머지 부분을 가져온다.
aug = A.Crop(x_min=90, y_min=60, x_max=300, y_max=200, p=1)
repeat_aug(original_image=image, aug_image=aug_image, target='Crop', aug=aug, ncols=2)

In [None]:
aug = A.Compose([
    A.Crop(x_min=90, y_min=60, x_max=300, y_max=200, p=1),
    A.Resize(250,250)
])
repeat_aug(original_image=image, aug_image=aug_image, target='Crop', aug=aug, ncols=2)
aug(image=image)['image'].shape

In [None]:
aug = A.CenterCrop(height=100, width=200, p=1)
repeat_aug(original_image=image, aug_image=aug_image, target='CenterCrop', aug=aug, ncols=2)
aug(image=image)['image'].shape

In [None]:
aug = A.Compose([
    A.CenterCrop(height=100, width=200, p=1),
    A.Resize(250,250)
])

repeat_aug(original_image=image, aug_image=aug_image, target='CenterCrop', aug=aug, ncols=2)
aug(image=image)['image'].shape

In [None]:
aug = A.RandomCrop(height=100, width=200, p=1)

repeat_aug(original_image=image, aug_image=aug_image, target='RandomCrop', aug=aug, ncols=2)
aug(image=image)['image'].shape

In [None]:
aug = A.Compose([
    A.RandomCrop(height=100, width=200, p=1),
    A.Resize(250,250)
])

repeat_aug(original_image=image, aug_image=aug_image, target='RandomCrop', aug=aug, ncols=2)
aug(image=image)['image'].shape

In [None]:
# 특정 영역을 scale 범위만큼 잘라낸 후, 전달한 width와 height 크기로 Resize 한다.
# 원본 이미지가 100 X 100일 경우 scale(0.1, 0.5)를 적용하면,
# 10 ~ 50% 범위의 랜덤한 영역을 잘라낸 후 resize해준다.
aug = A.RandomResizedCrop(height=250, width=250, scale=(0.2, 0.5), p=1)

repeat_aug(original_image=image, aug_image=aug_image, target='RandomResizedCrop', aug=aug, ncols=5)
aug(image=image)['image'].shape

In [None]:
# 밝기, 대비
# 0.2 == (-0.2, 0.2)
# 개별 작업 진행 시, 나머지는 0을 전달한다.
A.RandomBrightnessContrast(brightness_limit=0.2, contrast_limit=0.2, p=1)

repeat_aug(original_image=image, aug_image=aug_image, target='RandomBrightnessContrast', aug=aug, ncols=5)

In [None]:
# 색상, 채도, 명도
# hue_shift_limit
# sat_shift_limit
# val_shift_limit
aug = A.HueSaturationValue(p=1)

repeat_aug(original_image=image, aug_image=aug_image, target='HueSaturationValue', aug=aug, ncols=5)

In [None]:
# 밝기, 대비, 채도, 색상
aug = A.ColorJitter(p=1)

repeat_aug(original_image=image, aug_image=aug_image, target='ColorJitter', aug=aug, ncols=5)

In [None]:
# 채널 위치 변경
aug = A.ChannelShuffle(p=1)

repeat_aug(original_image=image, aug_image=aug_image, target='ChannelShuffle', aug=aug, ncols=5)

In [None]:
# 가우시안 분포(정규 분포)를 사용해서 Noise를 생성한다.
aug = A.GaussNoise(p=1, var_limit=(400, 900))

repeat_aug(original_image=image, aug_image=aug_image, target='GaussNoise', aug=aug, ncols=5)

In [None]:
# 명암 대비가 선명한 정도 조정
# 어두운 이미지가 많은 경우에 사용
aug = A.CLAHE(p=1, clip_limt=4)

repeat_aug(original_image=image, aug_image=aug_image, target='CLAHE', aug=aug, ncols=5)

In [None]:
# 가우시안 분포(정규 분포)를 사용해서 Noise를 생성한다.
aug = A.Blur(p=1, blur_limit=(3, 5))

repeat_aug(original_image=image, aug_image=aug_image, target='Blur', aug=aug, ncols=5)

In [None]:
aug = A.Compose([
    A.RandomResizedCrop(height=250, width=250, scale=(0.2, 0.5), p=0.5),
    A.ColorJitter(p=0.5),
    A.Resize(250,250,p=1)
], p=0.5)

repeat_aug(original_image=image, aug_image=aug_image, target='Compose', aug=aug, ncols=2)

In [None]:
# 여러 개 중 한 개만 골라서 적용
aug = A.Oneof([
    A.RandomResizedCrop(height=250, width=250, scale=(0.2, 0.5), p=0.5),
    A.ColorJitter(p=0.5),
    A.Resize(250,250,p=1)
], p=0.5)

repeat_aug(original_image=image, aug_image=aug_image, target='Oneof', aug=aug, ncols=2)

In [None]:
# 검은색 정사각형을 랜덤하게 배치하여 noise를 발생시킨다.
aug = A.CoarseDropout(max_holse=100, max_height=10, max_width=10, p=0.5)

repeat_aug(original_image=image, aug_image=aug_image, target='CoarseDropout', aug=aug, ncols=2)

### 🚩 정리
#### 기본적으로 많이 사용되는 변환은 아래와 같다.

- Vertical (상하)
- Horizontal (좌우)
- ShiftScaleRotation (이동, zoom, 회전)
- RandomCrop(랜덤 크롭), CenterCrop(센터 크롭), RandomBrightnessContrast (밝기, 대비)
- ColorJitter (색상, 채도, 명도)
- CLAHE(명암 대비를 통한 선명도 조정), Blur (블러-nosie), CoarseDropout (noise 추가)

이렇게 쓰게 되면 똑같은 것으로 fit을 2~3번 해야 하며, p는 웬만하면 0.5로 진행

In [None]:
import albumentations as A
from tensorflow.keras.preprocessing.image import ImageDataGenerator

def transform(image):
    aug = A.Compose([
        A.HorizontalFlip(p=0.5),
        A.VerticalFlip(p=0.5),
        A.OneOf([
            A.ColorJitter(p=1),
            A.RandomBrightnessContrast(brightness_limit=0.2, contrast_limit=0.2, p=0.5)
        ], p=1)
    ], 0.5)
    
    return aug(image=image)['image']

idg =ImageDataGenerator(preprocessing_function=transform, rescale=1./255)

Xray같은 것은 사용 노노, 상황에 맞게 진행