In [1]:
#Keras를 이용한 Augmentation
# example of horizontal shift image augmentation
from numpy import expand_dims
from keras.preprocessing.image import load_img
from keras.preprocessing.image import img_to_array
from keras.preprocessing.image import ImageDataGenerator
import matplotlib.pyplot as plt
# load the image
img = load_img('bird.jpg')
# convert to numpy array
data = img_to_array(img)
# expand dimension to one sample
samples = expand_dims(data, 0)

# create image data augmentation generator
# 아래의 6개 옵션 중 하나를 고르거나 여러 옵션을 동시에 주시면 됩니다.
datagen = ImageDataGenerator(width_shift_range=[-200,200])
# 나머지 5개 옵션
# height_shift_range=0.5, horizontal_flip=True, rotation_range=90, brightness_range=[0.2,1.0], zoom_range=[0.5,1.0]

# prepare iterator
it = datagen.flow(samples, batch_size=1)
# generate samples and plot
for i in range(9):
    # define subplot
    plt.subplot(330 + 1 + i)
    # generate batch of images
    batch = it.next()
    # convert to unsigned integers for viewing
    image = batch[0].astype('uint8')
    # plot raw pixel data
    plt.imshow(image)
# show the figure
# plt.show()
# plt.savefig('a.png')


ModuleNotFoundError: No module named 'elice_utils'

In [2]:
# OpenCV를 이용한 Augmentation
import cv2
import numpy as np

#co-relation between Opencv and Pillow Image Rectangle box
# (x1, y1) (left, top)
# (right, bottom) (x2, y2)

# (top,right,bottom,left)
# (32,64,0,0)

Folder_name="augmented_image"
Extension=".jpg"

#RESIZE
def resize_image(image,w,h):
    image=cv2.resize(image,(w,h))
    cv2.imwrite(Folder_name+"/Resize-"+str(w)+"*"+str(h)+Extension, image)

#crop
def crop_image(image,y1,y2,x1,x2):
    image=image[y1:y2,x1:x2]
    cv2.imwrite(Folder_name+"/Crop-"+str(x1)+str(x2)+"*"+str(y1)+str(y2)+Extension, image)

def padding_image(image,topBorder,bottomBorder,leftBorder,rightBorder,color_of_border=[0,0,0]):
    image = cv2.copyMakeBorder(image,topBorder,bottomBorder,leftBorder,
        rightBorder,cv2.BORDER_CONSTANT,value=color_of_border)
    cv2.imwrite(Folder_name + "/padd-" + str(topBorder) + str(bottomBorder) + "*" + str(leftBorder) + str(rightBorder) + Extension, image)

def flip_image(image,dir):
    image = cv2.flip(image, dir)
    cv2.imwrite(Folder_name + "/flip-" + str(dir)+Extension, image)

def invert_image(image,channel):
    # image=cv2.bitwise_not(image)
    image=(channel-image)
    cv2.imwrite(Folder_name + "/invert-"+str(channel)+Extension, image)

def add_light(image, gamma=1.0):
    invGamma = 1.0 / gamma
    table = np.array([((i / 255.0) ** invGamma) * 255
                      for i in np.arange(0, 256)]).astype("uint8")

    image=cv2.LUT(image, table)
    if gamma>=1:
        cv2.imwrite(Folder_name + "/light-"+str(gamma)+Extension, image)
    else:
        cv2.imwrite(Folder_name + "/dark-" + str(gamma) + Extension, image)

def add_light_color(image, color, gamma=1.0):
    invGamma = 1.0 / gamma
    image = (color - image)
    table = np.array([((i / 255.0) ** invGamma) * 255
                      for i in np.arange(0, 256)]).astype("uint8")

    image=cv2.LUT(image, table)
    if gamma>=1:
        cv2.imwrite(Folder_name + "/light_color-"+str(gamma)+Extension, image)
    else:
        cv2.imwrite(Folder_name + "/dark_color" + str(gamma) + Extension, image)

def saturation_image(image,saturation):
    image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)

    v = image[:, :, 2]
    v = np.where(v <= 255 - saturation, v + saturation, 255)
    image[:, :, 2] = v

    image = cv2.cvtColor(image, cv2.COLOR_HSV2BGR)
    cv2.imwrite(Folder_name + "/saturation-" + str(saturation) + Extension, image)

def hue_image(image,saturation):
    image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)

    v = image[:, :, 2]
    v = np.where(v <= 255 + saturation, v - saturation, 255)
    image[:, :, 2] = v

    image = cv2.cvtColor(image, cv2.COLOR_HSV2BGR)
    cv2.imwrite(Folder_name + "/hue-" + str(saturation) + Extension, image)

def scale_image(image,fx,fy):
    image = cv2.resize(image,None,fx=fx, fy=fy, interpolation = cv2.INTER_CUBIC)
    cv2.imwrite(Folder_name+"/Scale-"+str(fx)+str(fy)+Extension, image)

def translation_image(image,x,y):
    rows, cols ,c= image.shape
    M = np.float32([[1, 0, x], [0, 1, y]])
    image = cv2.warpAffine(image, M, (cols, rows))
    cv2.imwrite(Folder_name + "/Translation-" + str(x) + str(y) + Extension, image)

def rotate_image(image,deg):
    rows, cols,c = image.shape
    M = cv2.getRotationMatrix2D((cols/2,rows/2), deg, 1)
    image = cv2.warpAffine(image, M, (cols, rows))
    cv2.imwrite(Folder_name + "/Rotate-" + str(deg) + Extension, image)

def transformation_image(image):
    rows, cols, ch = image.shape
    pts1 = np.float32([[50, 50], [200, 50], [50, 200]])
    pts2 = np.float32([[10, 100], [200, 50], [100, 250]])
    M = cv2.getAffineTransform(pts1, pts2)
    image = cv2.warpAffine(image, M, (cols, rows))
    cv2.imwrite(Folder_name + "/Transformations-" + str(1) + Extension, image)

    pts1 = np.float32([[50, 50], [200, 50], [50, 200]])
    pts2 = np.float32([[100, 10], [200, 50], [0, 150]])
    M = cv2.getAffineTransform(pts1, pts2)
    image = cv2.warpAffine(image, M, (cols, rows))
    cv2.imwrite(Folder_name + "/Transformations-" + str(2) + Extension, image)

    pts1 = np.float32([[50, 50], [200, 50], [50, 200]])
    pts2 = np.float32([[100, 10], [200, 50], [30, 175]])
    M = cv2.getAffineTransform(pts1, pts2)
    image = cv2.warpAffine(image, M, (cols, rows))
    cv2.imwrite(Folder_name + "/Transformations-" + str(3) + Extension, image)

    pts1 = np.float32([[50, 50], [200, 50], [50, 200]])
    pts2 = np.float32([[100, 10], [200, 50], [70, 150]])
    M = cv2.getAffineTransform(pts1, pts2)
    image = cv2.warpAffine(image, M, (cols, rows))
    cv2.imwrite(Folder_name + "/Transformations-" + str(4) + Extension, image)


image_file="cat.jpg"
image=cv2.imread(image_file)
resize_image(image,450,400)

#(y1,y2,x1,x2)(bottom,top,left,right)
crop_image(image,100,400,0,350); crop_image(image,100,400,100,450); crop_image(image,0,300,0,350); crop_image(image,0,300,100,450); crop_image(image,100,300,100,350)
padding_image(image,100,0,0,0); padding_image(image,0,100,0,0); padding_image(image,0,0,100,0); padding_image(image,0,0,0,100); padding_image(image,100,100,100,100)
# 가로, 세로, 둘다
flip_image(image,0); flip_image(image,1); flip_image(image,-1)
invert_image(image,255); invert_image(image,200); invert_image(image,150); invert_image(image,100); invert_image(image,50)
add_light(image,1.5); add_light(image,2.0); add_light(image,2.5); add_light(image,3.0); add_light(image,4.0); add_light(image,5.0); add_light(image,0.7); add_light(image,0.4); add_light(image,0.3); add_light(image,0.1)
add_light_color(image,255,1.5); add_light_color(image,200,2.0); add_light_color(image,150,2.5); add_light_color(image,100,3.0); add_light_color(image,50,4.0); add_light_color(image,255,0.7); add_light_color(image,150,0.3); add_light_color(image,100,0.1)
saturation_image(image,50); saturation_image(image,100); saturation_image(image,150); saturation_image(image,200)
hue_image(image,50); hue_image(image,100); hue_image(image,150); hue_image(image,200)
scale_image(image,0.3,0.3); scale_image(image,0.7,0.7); scale_image(image,2,2); scale_image(image,3,3)
translation_image(image,150,150); translation_image(image,-150,150); translation_image(image,150,-150); translation_image(image,-150,-150)
rotate_image(image,90); rotate_image(image,180); rotate_image(image,270)
transformation_image(image)

error: OpenCV(4.1.0) C:\projects\opencv-python\opencv\modules\imgproc\src\resize.cpp:3718: error: (-215:Assertion failed) !ssize.empty() in function 'cv::resize'


# 과소적합 (Underfitting)
과소적합 (Underfitting)은 학습 데이터를 충분히 학습하지 못하여 테스트 성능도 떨어지는 경우를 말합니다.

Underfitting을 야기시키는 원인은 아래와 같은 경우가 있습니다.

* 데이터의 개수가 부족한 경우
* 데이터의 Bias가 너무 큰 경우
* 충분한 학습이 부족한 경우
* 데이터에 비해 모델이 너무 단순한 경우

IMDb 데이터세트를 이용해 기존 모델과 과소적합 모델을 비교해보겠습니다.

이번 실습에서는 데이터 개수와 모델을 조절해보며 과소적합 모델을 학습시켜보고 Train & Test loss가 어떻게 되는지 그래프로 확인해보겠습니다.

관련 링크 https://www.tensorflow.org/beta/tutorials/keras/overfit_and_underfit

### 실습
작성된 코드를 보고 이해해보세요. 

data_num을 바꿔가며 데이터의 개수에 따라 각 모델의 학습이 어떻게 진행되는지 확인해보세요.

keras.layers.Dense()안의 노드 개수를 바꿔가며 모델의 학습이 어떻게 진행되는지 확인해보세요.

model.fit() 내부에서 epoch를 바꿔가며 과소적합 되는 모델을 만들어보세요.

Visualize() 함수로 Train, Test loss 를 확인하고 과소적합 모델의 결과를 분석해보세요.

In [3]:
import numpy as np
import pandas as pd
import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow import keras

# 각각 리뷰에 따른 데이터 길이가 다르기 때문에 데이터의 Shape을 맞춰줘야합니다.
def sequences_shaping(sequences, dimension):
    # 0으로 채워진 (len(sequences), dimension) 크기의 행렬을 만듭니다
    results = np.zeros((len(sequences), dimension))
    for i, word_indices in enumerate(sequences):
        results[i, word_indices] = 1.0  # 각 리뷰 별 빈도수가 높은 단어를 dimension 개수 만큼만 추출하여 사용합니다.
        
    return results

# 시각화 함수
def Visualize(histories, key='binary_crossentropy'):
    #plt.figure(figsize=(,20))

    for name, history in histories:
        val = plt.plot(history.epoch, history.history['val_'+key],
                   '--', label=name.title()+' Val')
        plt.plot(history.epoch, history.history[key], color=val[0].get_color(),
             label=name.title()+' Train')

    plt.xlabel('Epochs')
    plt.ylabel(key.replace('_',' ').title())
    plt.legend()

    plt.xlim([0,max(history.epoch)])
    
#     plt.savefig("plot.png")

# 100번째 까지 많이 사용하는 단어까지 추출
word_num = 100
data_num = 60

# Keras에 내장되어 있는 imdb 데이터 세트를 불러옵니다.
# IMDb 데이터 세트는 Train 25000개 test 25000개로 이루어져 있습니다.
(train_data, train_labels), (test_data, test_labels) = keras.datasets.imdb.load_data(num_words=word_num)

# 데이터 Shape을 맞춰주기 위한 sequence 함수를 불러옵니다.
train_data = sequences_shaping(train_data, dimension=word_num)
test_data = sequences_shaping(test_data, dimension=word_num)

# 메모리 효율 및 과소적합을 위해 데이터 중 data_num개만 사용합니다.
train_data = train_data[:data_num,:]
test_data = test_data[:data_num,:]
train_labels = train_labels[:data_num]
test_labels =test_labels[:data_num]

# 과소적합 경우와 비교하기 위해 기본 모델을 하나 만들어줍니다.

basic_model = keras.Sequential([
    # `.summary` 메서드 때문에 `input_shape`가 필요합니다
    # 첫 번째 Layer에 데이터를 넣을때는 input_shape을 맞춰줘야합니다.
    keras.layers.Dense(16, activation=tf.nn.relu, input_shape=(word_num,)),
    keras.layers.Dense(16, activation=tf.nn.relu),
    # Regression 이므로 마지막 Node는 1개로 고정해주세요.
    keras.layers.Dense(1, activation=tf.nn.sigmoid)
])

# 과소적합 모델입니다.
underfitting_model = keras.Sequential([
    keras.layers.Dense(2, activation=tf.nn.relu, input_shape=(word_num,)),
    keras.layers.Dense(2, activation=tf.nn.relu),
    # Regression 이므로 마지막 Node는 1개로 고정해주세요.
    keras.layers.Dense(1, activation=tf.nn.sigmoid)
])

# 기존 모델을 학습시킬 최적화 방법, loss 계산 방법, 평가 방법을 설정합니다.
basic_model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['accuracy', 'binary_crossentropy'])
# 현재 모델이 어떻게 이루어져있는지 출력합니다.
basic_model.summary()
# 모델을 학습시킵니다.
baseline_history = basic_model.fit(train_data,train_labels,epochs=20,batch_size=500,validation_data=(test_data, test_labels), verbose=2)

# 기존 모델을 학습시킬 최적화 방법, loss 계산 방법, 평가 방법을 설정합니다.
underfitting_model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['accuracy', 'binary_crossentropy'])
# 현재 모델이 어떻게 이루어져있는지 출력합니다.
underfitting_model.summary()
# 모델을 학습시킵니다.
# Epoch를 바꿔가며 모델을 Underfitting 시켜보세요.
underfitting_history = underfitting_model.fit(train_data, train_labels, epochs=10, batch_size=500, validation_data=(test_data, test_labels),verbose=2)


# 각 모델 별 Loss 그래프를 그려줍니다.
Visualize([('basic', baseline_history),('Underfitting', underfitting_history)])
              


ModuleNotFoundError: No module named 'matplotlib.pyplot'

# 과대적합 (Overfitting)
과대적합 (Overfitting)은 모델이 학습 데이터에만 너무 치중되어 학습 데이터의 예측 성능은 좋으나 테스트 데이터의 성능이 떨어지는 경우를 말합니다.

모델이 과대적합이 되면 일반화 되지 않은 모델이라고도 합니다.

과대적합을 야기시키는 원인은 아래와 같습니다.

* 데이터의 Variance가 높은 경우
* 너무 많은 Epoch로 학습 데이터를 학습시킨 경우
* 학습에 사용된 파라미터가 너무 많은 경우
* 데이터에 비해 모델이 너무 복잡한 경우
* 데이터에 노이즈 & Outlier가 너무 많은 경우

이번 실습에서는 일부러 과대적합된 모델을 만들어 보고 Loss 그래프를 통해 기존 모델과 어떻게 성능 차이가 나는지 확인해보겠습니다.

관련 링크 https://www.tensorflow.org/beta/tutorials/keras/overfit_and_underfit
### 실습
작성된 코드를 보고 이해해보세요.

data_num을 바꿔가며 데이터의 개수에 따라 각 모델의 학습이 어떻게 진행되는지 확인해보세요.

keras.layers.Dense()안의 뉴런 개수를 바꿔가며 모델의 학습이 어떻게 진행되는지 확인해보세요.

model.fit() 내부에서 epoch를 바꿔가며 과소적합 되는 모델을 만들어보세요.

Visualize() 함수로 Train, Test loss 를 확인하고 과소적합 모델의 결과를 분석해보세요.

In [None]:
import numpy as np
import pandas as pd
import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow import keras

# 각각 리뷰에 따른 데이터 길이가 다르기 때문에 데이터의 Shape을 맞춰줘야합니다.
def sequences_shaping(sequences, dimension):
    # 0으로 채워진 (len(sequences), dimension) 크기의 행렬을 만듭니다
    results = np.zeros((len(sequences), dimension))
    for i, word_indices in enumerate(sequences):
        results[i, word_indices] = 1.0  # 각 리뷰 별 빈도수가 높은 단어를 dimension 개수 만큼만 추출하여 사용합니다.
        
    return results

# 시각화 함수
def Visulaize(histories, key='binary_crossentropy'):
    #plt.figure(figsize=(,20))

    for name, history in histories:
        val = plt.plot(history.epoch, history.history['val_'+key],
                   '--', label=name.title()+' Val')
        plt.plot(history.epoch, history.history[key], color=val[0].get_color(),
             label=name.title()+' Train')

    plt.xlabel('Epochs')
    plt.ylabel(key.replace('_',' ').title())
    plt.legend()

    plt.xlim([0,max(history.epoch)])
    
#     plt.savefig("plot.png")

# 100번째 까지 많이 사용하는 단어까지 추출
word_num = 100
data_num = 250000

# Keras에 내장되어 있는 imdb 데이터 세트를 불러옵니다.
# IMDb 데이터 세트는 Train 25000개 test 25000개로 이루어져 있습니다.
(train_data, train_labels), (test_data, test_labels) = keras.datasets.imdb.load_data(num_words=word_num)

# 데이터 Shape을 맞춰주기 위한 sequence 함수를 불러옵니다.
train_data = sequences_shaping(train_data, dimension=word_num)
test_data = sequences_shaping(test_data, dimension=word_num)

# 메모리 효율 및 과대적합을 위해 데이터 중 data_num개만 사용합니다.
train_data = train_data[:data_num,:]
test_data = test_data[:data_num,:]
train_labels = train_labels[:data_num]
test_labels =test_labels[:data_num]

# 과대적합 경우와 비교하기 위해 기본 모델을 하나 만들어줍니다.
basic_model = keras.Sequential([
    # `.summary` 메서드 때문에 `input_shape`가 필요합니다
    # 첫 번째 Layer에 데이터를 넣을때는 input_shape을 맞춰줘야합니다.
    keras.layers.Dense(16, activation=tf.nn.relu, input_shape=(word_num,)),
    keras.layers.Dense(16, activation=tf.nn.relu),
    keras.layers.Dense(1, activation=tf.nn.sigmoid)
])

# Neuron 개수를 바꿔가면서 과대적합 모델을 만들어보세요.
overfitting_model = keras.Sequential([
    keras.layers.Dense(5, activation=tf.nn.relu, input_shape=(word_num,)),
    keras.layers.Dense(5, activation=tf.nn.relu),
    keras.layers.Dense(1, activation=tf.nn.sigmoid)
])

# 기존 모델을 학습시킬 최적화 방법, loss 계산 방법, 평가 방법을 설정합니다.
basic_model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['accuracy', 'binary_crossentropy'])
# 현재 모델이 어떻게 이루어져있는지 출력합니다.
basic_model.summary()
# 모델을 학습시킵니다.
basic_history = basic_model.fit(train_data,train_labels,epochs=20,batch_size=500,validation_data=(test_data, test_labels), verbose=2)

# 기존 모델을 학습시킬 최적화 방법, loss 계산 방법, 평가 방법을 설정합니다.
overfitting_model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['accuracy', 'binary_crossentropy'])
# 현재 모델이 어떻게 이루어져있는지 출력합니다.
overfitting_model.summary()
# 모델을 학습시킵니다.
# Epoch를 바꿔가면서 학습시켜보세요.
overfitting_history = overfitting_model.fit(train_data, train_labels, epochs=10, batch_size=500, validation_data=(test_data, test_labels),verbose=2)


# 각 모델 별 Loss 그래프를 그려줍니다.
Visulaize([('Basic', basic_history),('Onderfitting', overfitting_history)])
              


# 드롭 아웃 (Drop out)
드롭 아웃 (Drop Out)은 모델이 과적합되는 것을 막기 위한 가장 보편적인 Regularization 기법 중 하나입니다.

https://kasausyrzlhe1066469.cdn.ntruss.com/global/file/p/5d27dc6afa5d6f586dc75417/Dropout.png

드롭 아웃은 데이터를 학습할 때, 일부 뉴런을 랜덤하게 0으로 만들어 모델 내부의 특정 Weight에 치중되는 것을 막습니다.

이를 통해 모델이 특정 데이터에 치중되는 것을 막고 일반화된 모델을 만들 수 있습니다.

드롭 아웃을 사용하는데 있어 주의할 점은 학습이 끝난 후 테스트 과정에서는 드롭 아웃을 사용하면 안된다는 점입니다.

이번 실습에서 드롭 아웃을 적용한 모델과 적용하지 않은 모델의 Loss 차이를 보겠습니다.

관련 링크 https://www.tensorflow.org/beta/tutorials/keras/overfit_and_underfit
### 실습
#### Drop-out Layer

* keras.layers.Dropout(prob)
    * prob : 드롭 아웃을 적용할 확률 (0.1 ~ 0.5)
    
작성된 코드를 보며 이해해보세요.

dropout_model에 Dropout Layer를 추가해보세요.

basic_model과dropout_model의 Loss 그래프를 확인해보세요.

In [4]:
import numpy as np
import pandas as pd
import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow import keras

# 각각 리뷰에 따른 데이터 길이가 다르기 때문에 데이터의 Shape을 맞춰줘야합니다.
def sequences_shaping(sequences, dimension):
    # 0으로 채워진 (len(sequences), dimension) 크기의 행렬을 만듭니다
    results = np.zeros((len(sequences), dimension))
    for i, word_indices in enumerate(sequences):
        results[i, word_indices] = 1.0  # 각 리뷰 별 빈도수가 높은 단어를 dimension 개수 만큼만 추출하여 사용합니다.
        
    return results

# 시각화 함수
def Visulaize(histories, key='binary_crossentropy'):
    #plt.figure(figsize=(,20))

    for name, history in histories:
        val = plt.plot(history.epoch, history.history['val_'+key],
                   '--', label=name.title()+' Val')
        plt.plot(history.epoch, history.history[key], color=val[0].get_color(),
             label=name.title()+' Train')

    plt.xlabel('Epochs')
    plt.ylabel(key.replace('_',' ').title())
    plt.legend()

    plt.xlim([0,max(history.epoch)])
    
#     plt.savefig("plot.png")

# 100번째 까지 많이 사용하는 단어까지 추출
word_num = 100
data_num = 20000

# Keras에 내장되어 있는 imdb 데이터 세트를 불러옵니다.
# IMDb 데이터 세트는 Train 25000개 test 25000개로 이루어져 있습니다.
(train_data, train_labels), (test_data, test_labels) = keras.datasets.imdb.load_data(num_words=word_num)

# 데이터 Shape을 맞춰주기 위한 sequence 함수를 불러옵니다.
train_data = sequences_shaping(train_data, dimension=word_num)
test_data = sequences_shaping(test_data, dimension=word_num)

# 메모리 효율을 위해 데이터 중 data_num개만 사용합니다.
train_data = train_data[:data_num,:]
test_data = test_data[:data_num,:]
train_labels = train_labels[:data_num]
test_labels =test_labels[:data_num]

# 드롭 아웃을 적용한 모델과 비교하기 위해 기본 모델을 하나 만들어줍니다.

basic_model = keras.Sequential([
    # `.summary` 메서드 때문에 `input_shape`가 필요합니다
    # 첫 번째 Layer에 데이터를 넣을때는 input_shape을 맞춰줘야합니다.
    keras.layers.Dense(64, activation=tf.nn.relu, input_shape=(word_num,)),
    keras.layers.Dense(64, activation=tf.nn.relu),
    keras.layers.Dense(1, activation=tf.nn.sigmoid)
])

# 각 Layer에 Dropout이 적용된 모델을 만들어보세요.
dropout_model = keras.Sequential([
    keras.layers.Dense(64, activation=tf.nn.relu, input_shape=(word_num,)),
    # Dense (Fully Connected) Layer에 드롭 아웃을 적용해보세요.
    keras.layers.Dropout(0.3),
    keras.layers.Dense(64, activation=tf.nn.relu),
    # Dense (Fully Connected) Layer에 드롭 아웃을 적용해보세요.
    keras.layers.Dropout(0.4),
    keras.layers.Dense(1, activation=tf.nn.sigmoid)
])

# 기존 모델을 학습시킬 최적화 방법, loss 계산 방법, 평가 방법을 설정합니다.
basic_model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['accuracy', 'binary_crossentropy'])
# 현재 모델이 어떻게 이루어져있는지 출력합니다.
basic_model.summary()
# 모델을 학습시킵니다.
basic_history = basic_model.fit(train_data,train_labels,epochs=20,batch_size=500,validation_data=(test_data, test_labels), verbose=2)

# 기존 모델을 학습시킬 최적화 방법, loss 계산 방법, 평가 방법을 설정합니다.
dropout_model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['accuracy', 'binary_crossentropy'])
# 현재 모델이 어떻게 이루어져있는지 출력합니다.
dropout_model.summary()
# Drop out이 적용된 모델을 학습시킵니다.
dropout_history = dropout_model.fit(train_data, train_labels, epochs=20, batch_size=500, validation_data=(test_data, test_labels),verbose=2)


# 각 모델 별 Loss 그래프를 그려줍니다.
Visulaize([('Basic', basic_history),('Dropout', dropout_history)])
              


ModuleNotFoundError: No module named 'matplotlib.pyplot'

# L1 Regularization
L1 Regularization은 가중치 (Weight)의 절댓값에 비례하는 Loss가 기존 손실 함수에 추가되는 형태입니다.

Total Loss = Loss + \lambda\sum_w|W| 

L1 Regularization은 모델 내의 일부 가중치를 0으로 만들어 의미있는 가중치만 남도록 만들어줍니다. 이를 통해 모델을 일반화시킬 수 있습니다. 다른 말로 Sparse Model을 만든다 라고도 합니다.

L1 Regularization을 모델에 적용하기 위해 kernel.layers.Dense() 내부에 인자로 keras.regularizers.l1(ratio)을 추가할 수 있습니다.

L1 Regularization -keras.regularizers.l1(ratio) - ratio : L1을 적용하는 비율 (0.001 ~0.005)

* keras.layers.Dense(kernel_regularizer, bias_regularizer, activity_regularizer)
    * kernel_regularizer : Weight에 Regularization 적용
    * bias_regularizer : Bias에 Regularization 적용
    * activity_regularizer : Output y에 Regularization 적용
    
관련 링크 https://www.tensorflow.org/beta/tutorials/keras/overfit_and_underfit https://www.tensorflow.org/versions/r2.0/api_docs/python/tf/keras/layers/Dense
### 실습
작성된 코드를 보며 이해해보세요.

L1_regularization_model()에 L1 regularization을 추가해보세요.

basic_model과L1_regularization_model의 Loss 그래프를 확인하고 과적합을 얼마나 완화시켰는지 분석해보세요.

In [5]:
import numpy as np
import pandas as pd
import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow import keras


# 각각 리뷰에 따른 데이터 길이가 다르기 때문에 데이터의 Shape을 맞춰줘야합니다.
def sequences_shaping(sequences, dimension):
    # 0으로 채워진 (len(sequences), dimension) 크기의 행렬을 만듭니다
    results = np.zeros((len(sequences), dimension))
    for i, word_indices in enumerate(sequences):
        results[i, word_indices] = 1.0  # 각 리뷰 별 빈도수가 높은 단어를 dimension 개수 만큼만 추출하여 사용합니다.
        
    return results

# 시각화 함수
def Visulaize(histories, key='binary_crossentropy'):
    #plt.figure(figsize=(,20))

    for name, history in histories:
        val = plt.plot(history.epoch, history.history['val_'+key],
                   '--', label=name.title()+' Val')
        plt.plot(history.epoch, history.history[key], color=val[0].get_color(),
             label=name.title()+' Train')

    plt.xlabel('Epochs')
    plt.ylabel(key.replace('_',' ').title())
    plt.legend()

    plt.xlim([0,max(history.epoch)])
    
#     plt.savefig("plot.png")

# 100번째 까지 많이 사용하는 단어까지 추출
word_num = 100
data_num = 25000

# Keras에 내장되어 있는 imdb 데이터 세트를 불러옵니다.
# IMDb 데이터 세트는 Train 25000개 test 25000개로 이루어져 있습니다.
(train_data, train_labels), (test_data, test_labels) = keras.datasets.imdb.load_data(num_words=word_num)

# 데이터 Shape을 맞춰주기 위한 sequence 함수를 불러옵니다.
train_data = sequences_shaping(train_data, dimension=word_num)
test_data = sequences_shaping(test_data, dimension=word_num)

# L1 Regularization 모델와 비교하기 위해 기본 모델을 하나 만들어줍니다.
basic_model = keras.Sequential([
    # `.summary` 메서드 때문에 `input_shape`가 필요합니다
    # 첫 번째 Layer에 데이터를 넣을때는 input_shape을 맞춰줘야합니다.
    keras.layers.Dense(128, activation=tf.nn.relu, input_shape=(word_num,)),
    keras.layers.Dense(128, activation=tf.nn.relu),
    keras.layers.Dense(1, activation=tf.nn.sigmoid)
])

# 기존 모델에 L1 Regularization을 적용해보겠습니다.
L1_regularization_model = keras.Sequential([
    # 각 Dense (Fully Connected) Layer에 인자로 keras.regularizers.l1을 적용해보세요.
    # Kernel, bias, activity에 하나씩 적용해보며 결과를 비교해보세요.
    keras.layers.Dense(128, activation=tf.nn.relu, input_shape=(word_num,), kernel_regularizer= keras.regularizers.l1(0.001)),
    keras.layers.Dense(128, activation=tf.nn.relu, kernel_regularizer = keras.regularizers.l1(0.005)),
    keras.layers.Dense(1, activation=tf.nn.sigmoid)
])

# 기존 모델을 학습시킬 최적화 방법, loss 계산 방법, 평가 방법을 설정합니다.
basic_model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['accuracy', 'binary_crossentropy'])
# 현재 모델이 어떻게 이루어져있는지 출력합니다.
basic_model.summary()
# 모델을 학습시킵니다.
basic_history = basic_model.fit(train_data,train_labels,epochs=20,batch_size=500,validation_data=(test_data, test_labels), verbose=2)

# L1 모델을 학습시킬 최적화 방법, loss 계산 방법, 평가 방법을 설정합니다.
L1_regularization_model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['accuracy', 'binary_crossentropy'])
# L1 모델이 어떻게 이루어져있는지 출력합니다.
L1_regularization_model.summary()
# L1 모델을 학습시킵니다.
L1_regularization_history = L1_regularization_model.fit(train_data, train_labels, epochs=20, batch_size=500, validation_data=(test_data, test_labels),verbose=2)


# 각 모델 별 Loss 그래프를 그려줍니다.
Visulaize([('Basic', basic_history),('L1 Regularization', L1_regularization_history)])
              


ModuleNotFoundError: No module named 'matplotlib.pyplot'

# L2 Regularization
L2 Regularization은 가중치 (Weight)의 제곱에 비례하는 Loss가 기존 손실 함수에 추가되는 형태입니다.

Total Loss = Loss + \lambda\sum_wW^2  

L2 Regularization은 학습이 진행될 때 가중치의 값이 0에 가까워지도록 만들어줍니다. 가중치를 0으로 만들어주는 L1 Regularization와는 차이가 있습니다.

이를 통해 특정 가중치에 치중되지 않도록 가중치 값을 조율하게 되며 Weight Decay 라고도 부릅니다.

L1 Regularization과 같이 kernel.layers.Dense() 내부에 인자로 keras.regularizers.l2(ratio)을 추가할 수 있습니다.

L2 Regularization -keras.regularizers.l2(ratio) - ratio : L2을 적용하는 비율 (0.001 ~0.005)

* keras.layers.Dense(kernel_regularizer, bias_regularizer, activity_regularizer)
    * kernel_regularizer : Weight에 Regularization 적용
    * bias_regularizer : Bias에 Regularization 적용
    * activity_regularizer : Output y에 Regularization 적용
    
관련 링크 https://www.tensorflow.org/beta/tutorials/keras/overfit_and_underfit https://www.tensorflow.org/versions/r2.0/api_docs/python/tf/keras/layers/Dense
### 실습
작성된 코드를 보며 이해해보세요.

L2_regularization_model()에 L2regularization을 추가해보세요.

basic_model과L2_regularization_model의 Loss 그래프를 확인하고 과적합을 얼마나 완화시켰는지 분석해보세요.

In [6]:
import numpy as np
import pandas as pd
import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow import keras

# 각각 리뷰에 따른 데이터 길이가 다르기 때문에 데이터의 Shape을 맞춰줘야합니다.
def sequences_shaping(sequences, dimension):
    # 0으로 채워진 (len(sequences), dimension) 크기의 행렬을 만듭니다
    results = np.zeros((len(sequences), dimension))
    for i, word_indices in enumerate(sequences):
        results[i, word_indices] = 1.0  # 각 리뷰 별 빈도수가 높은 단어를 dimension 개수 만큼만 추출하여 사용합니다.
        
    return results

# 시각화 함수
def Visulaize(histories, key='binary_crossentropy'):
    #plt.figure(figsize=(,20))

    for name, history in histories:
        val = plt.plot(history.epoch, history.history['val_'+key],
                   '--', label=name.title()+' Val')
        plt.plot(history.epoch, history.history[key], color=val[0].get_color(),
             label=name.title()+' Train')

    plt.xlabel('Epochs')
    plt.ylabel(key.replace('_',' ').title())
    plt.legend()

    plt.xlim([0,max(history.epoch)])
    
#     plt.savefig("plot.png")

# 100번째 까지 많이 사용하는 단어까지 추출
word_num = 100
data_num = 25000

# Keras에 내장되어 있는 imdb 데이터 세트를 불러옵니다.
# IMDb 데이터 세트는 Train 25000개 test 25000개로 이루어져 있습니다.
(train_data, train_labels), (test_data, test_labels) = keras.datasets.imdb.load_data(num_words=word_num)

# 데이터 Shape을 맞춰주기 위한 sequence 함수를 불러옵니다.
train_data = sequences_shaping(train_data, dimension=word_num)
test_data = sequences_shaping(test_data, dimension=word_num)

# L2 Regularization 모델와 비교하기 위해 기본 모델을 하나 만들어줍니다.
basic_model = keras.Sequential([
    # `.summary` 메서드 때문에 `input_shape`가 필요합니다
    # 첫 번째 Layer에 데이터를 넣을때는 input_shape을 맞춰줘야합니다.
    keras.layers.Dense(128, activation=tf.nn.relu, input_shape=(word_num,)),
    keras.layers.Dense(128, activation=tf.nn.relu),
    keras.layers.Dense(1, activation=tf.nn.sigmoid)
])

# 기존 모델에 L2 Regularization을 적용해보겠습니다.
L2_regularization_model = keras.Sequential([
    # 각 Dense (Fully Connected) Layer에 인자로 keras.regularizers.l1을 적용해보세요.
    # Kernel, bias, activity에 하나씩 적용해보며 결과를 비교해보세요.
    keras.layers.Dense(128, activation=tf.nn.relu, input_shape=(word_num,), kernel_regularizer= keras.regularizers.l2(0.005)),
    keras.layers.Dense(128, activation=tf.nn.relu, kernel_regularizer=keras.regularizers.l2(0.001)),
    keras.layers.Dense(1, activation=tf.nn.sigmoid)
])

# 기존 모델을 학습시킬 최적화 방법, loss 계산 방법, 평가 방법을 설정합니다.
basic_model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['accuracy', 'binary_crossentropy'])
# 현재 모델이 어떻게 이루어져있는지 출력합니다.
basic_model.summary()
# 모델을 학습시킵니다.
basic_history = basic_model.fit(train_data,train_labels,epochs=20,batch_size=500,validation_data=(test_data, test_labels), verbose=2)

# L2 모델을 학습시킬 최적화 방법, loss 계산 방법, 평가 방법을 설정합니다.
L2_regularization_model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['accuracy', 'binary_crossentropy'])
# L2 모델이 어떻게 이루어져있는지 출력합니다.
L2_regularization_model.summary()
# L2 모델을 학습시킵니다.
L2_regularization_history = L2_regularization_model.fit(train_data, train_labels, epochs=20, batch_size=500, validation_data=(test_data, test_labels),verbose=2)


# 각 모델 별 Loss 그래프를 그려줍니다.
Visulaize([('Basic', basic_history),('L2 Regularization', L2_regularization_history)])
              


ImportError: cannot import name 'rcParams'

# Well-Trained 모델 만들기
IMDb 데이터로 DNN을 학습시켜 보겠습니다.

Keras를 이용해 직접 만든 모델을 학습시키고 과소적함, 과대적합 되지 않도록 모델을 finetuning 해보세요.

Visualize()를 통해 Loss를 확인해보고 모델이 어떻게 학습되었는지 분석해보세요.

최종적으로 검증 정확도가 85% 이상이 되도록 네트워크를 구현해보세요.

### 미션
불러온 IMDb 데이터의 Shape을 확인해보세요.

L1_ratio, L2_ratio 를 설정하고 keras.regularizers를 선언해주세요.

keras.Sequential()로 model을 만들어보세요.

keras.layers.Dense() 를 쌓아 Layer를 추가해보세요.

Dropout, L1, L2 regularization 들을 적용해 model이 잘 학습되도록 만들어보세요.

test_accuracy가 85% 이상되도록 모델을 학습시켜보세요.

In [7]:
import numpy as np
import pandas as pd
import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow import keras

# 시각화 함수
def Visulaize(histories, key='binary_crossentropy'):
    for name, history in histories:
        val = plt.plot(history.epoch, history.history['val_'+key],
                   '--', label=name.title()+' Val')
        plt.plot(history.epoch, history.history[key], color=val[0].get_color(),
             label=name.title()+' Train')

    plt.xlabel('Epochs')
    plt.ylabel(key.replace('_',' ').title())
    plt.legend()

    plt.xlim([0,max(history.epoch)])
    
#     plt.savefig("plot.png")


word_num = 1000
data_num = 25000

# data 폴더에 있는 IMDb 데이터들을 불러옵니다.
# 각 데이터의 Shape을 확인하고 모델에 넣어주세요. np.shape() 사용
train_data = np.loadtxt('./data/train_data.txt', delimiter =',', dtype = np.float32)
train_labels = np.loadtxt('./data/train_labels.txt', delimiter =',', dtype = np.float32)
test_data = np.loadtxt('./data/test_data.txt', delimiter =',', dtype = np.float32)
test_labels = np.loadtxt('./data/test_labels.txt', delimiter =',', dtype = np.float32)

# L1, L2 ratio를 설정해주세요.
L1_ratio = 0.002
L2_ratio = 0.004

# Keras에 내장되어 있는 regularizers를 선언해주세요.
L1_regularizer = keras.regularizers.l1(L1_ratio)
L2_regularizer = keras.regularizers.l2(L2_ratio)


# IMDb 데이터를 학습할 모델을 만들어주세요.
model = keras.Sequential([
    # `.summary` 메서드 때문에 `input_shape`가 필요합니다
    # 첫 번째 Layer에 데이터를 넣을때는 input_shape을 맞춰줘야합니다.
    # Layer를 선언해 모델을 만들어보세요.
    keras.layers.Dense(128, activation=tf.nn.relu, input_shape=(word_num,), kernel_regularizer= L1_regularizer),
    keras.layers.Dropout(0.0002),
    keras.layers.Dense(128, activation=tf.nn.relu, kernel_regularizer= L2_regularizer),
    keras.layers.Dropout(0.0002),
    # 마지막 Layer
    keras.layers.Dense(1, activation=tf.nn.sigmoid)
])

# 기존 모델을 학습시킬 최적화 방법, loss 계산 방법, 평가 방법을 설정합니다.
model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['accuracy', 'binary_crossentropy'])
# 현재 모델이 어떻게 이루어져있는지 출력합니다.
model.summary()


# 모델을 학습시킵니다.
history = model.fit(train_data,train_labels,epochs=20,batch_size=500,validation_data=(test_data, test_labels), verbose=2)

# 학습된 모델을 Test_data로 검증해주세요.
pred = model.predict(test_data)
loss, test_accuracy, _ = model.evaluate(test_data, test_labels)
print('검증 정확도 :', test_accuracy)

# 모델의 Loss 그래프를 그려줍니다.
Visulaize([('Basic', history)])


ImportError: cannot import name 'rcParams'