# DF902_SunHwanPark

# 01

In [1]:
#1. Dense 레이어
#- 인공신경망 모형에 입력과 출력이 모두 연결된 은닉층(들)과, 출력층을 생성한다.(add 함수로 모델에 추가)
#	* 주요 파라미터
#	- units: 해당 층에 배치할 노드 수
#	- input_dim: 입력 특성의 수, 즉 입력 노드의 개수이다.(최초 은닉층 외에는 기재 X)
#	- kernel_initializer: 가중치들의 초기화, 설정 방법.
#	- activation: 활성화 함수.

#2. Flatten 레이어
#- 인공신경망 모형에 다차원 데이터를 1차원으로 변환해주는 층을 추가한다.('완전 연결'된 결합 은닉층으로 출력하는 역할)

#3. Conv2D
#- 인공신경망 모형에 합성곱층을 생성한다.(데이터의 특성 정보를 추출·축소하는 역할)
#	* 주요 파라미터
#	- filters: 필터(커널)의 개수.
#	- kernel_size: 필터(커널)의 크기.
#	- strides: 스트라이드(필터가 이동하는 간격) 값.
#	- padding: 패딩 적용 방법.("Same" -> 제로 패딩)
#	- activation: 활성화 함수.
#	- input_shape: 입력 특성 형태.(최초 은닉층 외에는 기재 X)

#4. MaxPooling2D
#- 인공신경망 모형에 풀링층(출력의 크기를 줄이는 역할)을 생성한다.(최대 풀링 방식)
#- pool_size: 적용할 풀링 크기.

# 02

In [17]:
import numpy as np
from keras.models import Sequential
from keras.layers import Dense
from keras.layers.convolutional import Conv2D
from keras.layers.convolutional import MaxPooling2D
from keras.layers import Flatten
from keras.preprocessing.image import ImageDataGenerator

In [18]:
np.random.seed(3)

In [35]:
train_datagen = ImageDataGenerator(rescale=1./255)

In [36]:
train_generator = train_datagen.flow_from_directory(
    'C:\\Users\\PARK SUNHWAN\\Desktop\\DS\\DF902\\DF902_Data\\DF902_Data_Galaxy_Resize\\train_galaxy',
    target_size=(50, 50),
    batch_size=1137,
    class_mode='categorical')

Found 10233 images belonging to 3 classes.


In [37]:
val_datagen = ImageDataGenerator(rescale=1./255)

In [38]:
val_generator = val_datagen.flow_from_directory(
    'C:\\Users\\PARK SUNHWAN\\Desktop\\DS\\DF902\\DF902_Data\\DF902_Data_Galaxy_Resize\\val_galaxy',
    target_size=(50, 50),
    batch_size=3,
    class_mode='categorical')

Found 600 images belonging to 3 classes.


In [39]:
test_datagen = ImageDataGenerator(rescale=1./255)

In [40]:
test_generator = test_datagen.flow_from_directory(
    'C:\\Users\\PARK SUNHWAN\\Desktop\\DS\\DF902\\DF902_Data\\DF902_Data_Galaxy_Resize\\test_galaxy',
    target_size=(50, 50),
    batch_size=3,
    class_mode='categorical')

Found 600 images belonging to 3 classes.


In [41]:
# A = flow_from_directory
# B = target_size
# C = batch_size
# D = class_mode

# 03

In [42]:
model = Sequential()

model.add(Conv2D(filters=32, kernel_size=(3, 3), activation='relu',\
                 input_shape=(50, 50, 3)))
model.add(Conv2D(filters=64, kernel_size=(3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Flatten())

model.add(Dense(units=128, activation='relu'))
model.add(Dense(units=3, activation='softmax'))

# 04

In [43]:
# 1. Relu 활성함수
# - Rectified Linear Unit
# - 입력값 < 0이면 0, 입력값 > 0이면 입력값을 그대로(linear) 출력.
# - 기존 활성함수로 많이 사용되던 sigmoid가 가진 문제 Gradient Vanishing을 해결하며 등장한 활성함수.
#     *Gradient Vanishing: 뉴럴 네트워크에서, 신경망이 깊어질수록 학습이 어려워지는 문제가 있어, 이를 해결하기 위해 전체 레이어를 한 번 계산한 후, 그 값을 역으로 다시 계산하는 Back Propagation을 사용한다.
#                          그런데 sigmoid 함수를 사용할 경우, 레이어가 깊어질수록 Back Propagation이 제대로 작동하지 않는 현상(값을 뒤에서 앞으로 전달할 때 희석이 되는 현상)이 발생했고, 이 현상을 Gradient Vanishing 이라고 한다.
# - 2가지 이상의 레이블 분류하는 경우 주로 사용!(sigmoid는 Gradient Vanishing 때문에 잘 사용 X)
# 뉴럴 네트워크의 은닉층 활성화 함수로 주로 사용.

# 2. softmax 활성함수
# - sigmoid(or Relu) 함수가 이산 분류(결과값에 따라 참 또는 거짓을 나타내는) 함수라면, softmax 함수는 여러 레이블 분류에 대한 확률 값을 출력할 수 있는 함수이다. 분류의 수 n에 대해, P(1) + P(2) + ... + P(n) = 1을 가지는 Pn값을 출력한다.
# - 3가지 이상의 레이블 분류하는 경우 주로 사용!
# - 뉴럴 네트워크 가장 마지막 부분에 주로 사용!(결과를 확률값을로 해석하기 위해)

# 05

In [44]:
model.compile(loss = 'categorical_crossentropy', optimizer = 'adam', metrics = ['accuracy'])

# 1. loss
# - 현재 모델의 가중치 세트를 평가하는 데 사용하는 손실 함수(cost function).
# - 현재 3가지 이상의 레이블을 분류하는 다중 클래스 문제이므로 'categorical_crossentrpy' 사용.

# 2. optimizer
# - 모델의 최적의 가중치(weight parameter)를 탐색하는 데 사용되는 최적화 알고리즘.
# - 최적을 값을 찾아가는 데 '방향성', '스탭사이즈' 모두를 고려하는 효율적인 Gradient Descent Optimizer 'adam' 사용.

# 06

In [45]:
hist = model.fit_generator(train_generator, steps_per_epoch=9, epochs=50,
             validation_data=val_generator, validation_steps=200)

Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50


In [56]:
print("--Evaluate--")
scores = model.evaluate_generator(test_generator, steps=200)
print("%s: %.2f%%" %(model.metrics_names[1], scores[1]*100))

--Evaluate--
acc: 82.33%


In [57]:
# A: fit_generator
# B: 9(# of traning data / batch size => 10,233 / 1137)
    # * 트레이닝 데이터 셋 크기에 비해 기존 배치 사이즈(3)가 너무 작아, steps 수가 지나치게 커짐 => 시간 너무 오래 걸림, overfitting 문제 확인 => 배치 사이즈 수정(3 -> 1137)
# C: 200(# of validation data / batch size => 600 / 3)
# D: evaluate_generator
# E: 200(# of test data / batch size => 600 / 3)