**AI 노바투스과정**

Week 3: 딥러닝 기초 I (2023-01-27)

실습 #4: 깊은 신경망 학습에 필요한 기술 익히기

In [None]:
# keras 라이브러리 가져오기
# df
# import keras -> import tensorflow.keras as keras
import tensorflow.keras as keras

In [None]:
# MNIST 패션 데이터 로딩하기

fashion_mnist = keras.datasets.fashion_mnist

In [None]:
(X_train_full, y_train_full), (X_test, y_test) = fashion_mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


In [None]:
# 라벨의 각 숫자값에 해당하는 클래스 명 지정하기

class_names=["T-shirt/top",'Trouser','Pullover','Dress',"Coat", "Sandal", "Shirt", "Sneaker", "Bag", "Ankle boot"]

In [None]:
# 학습용 데이터를 다시 학습용 데이터와 검증용 데이터 (valdiation set) 으로 분리
# 분리와 동시에 정규화

X_valid, X_train= X_train_full[:5000]/255.0, X_train_full[5000:]/255.0  # 5000개 까지 validation data, 55000개는 train data
y_valid, y_train= y_train_full[:5000], y_train_full[5000:]

X_test=X_test/255.0

## 1. 다양한 활성함수 사용해보기

In [None]:
# keras 의 Sequential API 를 활용하여 신경망 모형의 골격 만들기 
# 은닉층이 2개이며 첫번째 은닉층에 뉴런 300개, 두번째 은닉층에 뉴런 100개 인 골격 만들기
### 새로운 활성함수 사용해보기 !! 

model = keras.models.Sequential()  # 모델 초기화

model.add(keras.layers.Flatten(input_shape=[28,28])) # 28x28 2차원 이미지의 데이터를 1차원데이터로
model.add(keras.layers.Dense(300, activation="selu"))
model.add(keras.layers.Dense(100, activation="elu"))
model.add(keras.layers.Dense(10,  activation="softmax")) #10개의 class에 대한 확률값

# https://keras.io/ko/activations/ 

In [None]:
model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten_1 (Flatten)         (None, 784)               0         
                                                                 
 dense_3 (Dense)             (None, 300)               235500    
                                                                 
 dense_4 (Dense)             (None, 100)               30100     
                                                                 
 dense_5 (Dense)             (None, 10)                1010      
                                                                 
Total params: 266,610
Trainable params: 266,610
Non-trainable params: 0
_________________________________________________________________


## 2. 다양한 최적화 방법 사용해보기

In [None]:
# 모형 컴파일하기 (손실함수, 최적화 방법 지정하기)
### 다양한 최적화 방법 사용해보기 !

# https://keras.io/ko/optimizers/ 

#optim = keras.optimizers.SGD(clipvalue=1.0)
#optim = keras.optimizers.SGD(learning_rate=0.001, momentum=0.9)  # momentum
#optim = keras.optimizers.SGD(learning_rate=0.001, momentum=0.9, nesterov=True)  # NAG
#optim = keras.optimizers.RMSprop(learning_rate=0.001, rho=0.9)  # RMSprop
#optim = keras.optimizers.Adam(learning_rate=0.001, beta_1=0.9, beta_2=0.999)  # Adam
#model.compile(loss="sparse_categorical_crossentropy", optimizer=optimizer, metrics=["accuracy"])

optim = keras.optimizers.Adam(learning_rate=0.001)  # 학습률 지정 가능 
model.compile(loss="sparse_categorical_crossentropy", optimizer=optim, metrics=["accuracy"])


In [None]:
#모형 학습하기

history = model.fit(X_train, y_train, epochs=10, validation_data=(X_valid, y_valid))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


## 3. Dropout 사용해보기

In [None]:
# Dropout : 의도적으로 노드와 노드 사이의 연결을 랜덤으로 끊고 학습시키는 방법. 
# 노드와 노드 사이의 연결을 끊어 특정 가중치에 과하게 학습되지 않도록 함. --> 과적합 방지 

model = keras.models.Sequential()

model.add(keras.layers.Flatten(input_shape=[28,28]))
model.add(keras.layers.Dropout(rate=0.2))   # 20%의 확률로 레이어 노드간 연결을 끊음 
model.add(keras.layers.Dense(300,activation="elu"))
model.add(keras.layers.Dropout(rate=0.2))
model.add(keras.layers.Dense(100,activation="elu"))
model.add(keras.layers.Dropout(rate=0.2))
model.add(keras.layers.Dense(10,activation="softmax"))

In [None]:
model.compile(loss="sparse_categorical_crossentropy", optimizer="sgd", metrics=["accuracy"])


In [None]:
history = model.fit(X_train, y_train, epochs=10, validation_data=(X_valid, y_valid))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


## 4. Batch Normalization 사용해보기

In [None]:
# 배치 정규화 : 배치 단위로 신경망을 학습시키는데, 각 배치 입력 데이터들을 정규화하여 Gradient Descent 학습의 안정성 향상 
# 학습 과정에서 Batch마다 평균과 분산을 활용하여 데이터의 분포를 정규화하는 과정. 데이터 종류에 따라 값의 범위는 천차만별이기 때문에, Batch마다 입력값의 범위를 스케일링. 

model=keras.models.Sequential()

model.add(keras.layers.Flatten(input_shape=[28,28]))
model.add(keras.layers.BatchNormalization())
model.add(keras.layers.Dense(300,activation="elu"))
model.add(keras.layers.BatchNormalization())
model.add(keras.layers.Dense(100,activation="elu"))
model.add(keras.layers.BatchNormalization())
model.add(keras.layers.Dense(10,activation="softmax"))

In [None]:
model.summary()

Model: "sequential_4"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten_4 (Flatten)         (None, 784)               0         
                                                                 
 batch_normalization (BatchN  (None, 784)              3136      
 ormalization)                                                   
                                                                 
 dense_12 (Dense)            (None, 300)               235500    
                                                                 
 batch_normalization_1 (Batc  (None, 300)              1200      
 hNormalization)                                                 
                                                                 
 dense_13 (Dense)            (None, 100)               30100     
                                                                 
 batch_normalization_2 (Batc  (None, 100)             

In [None]:
model.compile(loss="sparse_categorical_crossentropy", optimizer="sgd", metrics=["accuracy"])


In [None]:
history = model.fit(X_train, y_train, epochs=10, validation_data=(X_valid, y_valid))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


## 5. L1, L2 규제 사용해보기

In [None]:
# 가중치 규제 (Weight Regularization) : 
# 최소화 하려는 손실함수에 가중치들의 합을 더해주어, 가중치들의 합도 같이 최소화. 특정 가중치에 과하게 학습되는것을 방지 --> 과적합 방지 
# L1 규제 : 가중치들의 절댓값 합 적용 
# L2 규제 : 가중치들의 제곱 합 적용 : 규제 강도가 더 강함

model = keras.models.Sequential()

model.add(keras.layers.Flatten(input_shape=[28,28]))
model.add(keras.layers.Dense(300,activation="elu"))
model.add(keras.layers.Dense(100,activation="elu", kernel_regularizer=keras.regularizers.l1(0.01)))
# model.add(keras.layers.Dense(100,activation="elu", kernel_regularizer=keras.regularizers.l2(0.01)))
model.add(keras.layers.Dense(10,activation="softmax"))



In [None]:
model.compile(loss="sparse_categorical_crossentropy", optimizer="sgd", metrics=["accuracy"])


In [None]:
history=model.fit(X_train, y_train, epochs=10, validation_data=(X_valid, y_valid))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
