<a href="https://colab.research.google.com/github/ArcticFoox/optimization/blob/main/LecNADL_T08_NN_based_LM.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **[Lecture-NADL] 딥러닝의 이해(1)**: 인공 신경망 기반 학습모델(1)

# **I. 대표적 문제: 다중 분류**
- MNIST: 손글씨 숫자 (0~9)

- NN 구조(예)
 - 입력층: 28x28
 - 은닉층: 1개, 완전연결망, #(뉴런)=128, 활성화함수(ReLU)
 - 출력층: #(뉴런)=10, 활성화함수(softmax)
 - 선택: dropout(p=0.2, 0.5, 0.8)

- 수치 최적화 Algo.
 - 선택: SGD, RMSPrpo, Adam 알고리즘
 - 선택: #(epoch) = 5

In [None]:
import tensorflow as tf

In [None]:
mnist = tf.keras.datasets.mnist

# MNIST 데이터 로딩: #(train data)=60,000, #(test data)=10,000
(x_train_full, y_train_full), (x_test, y_test) = mnist.load_data()
x_train_full, x_test = x_train_full / 255.0, x_test / 255.0

# 60,000개의 data --> 훈련(train)데이터, 검증(validation) 데이터로 나눔
x_valid, x_train = x_train_full[:5000], x_train_full[5000:]
y_valid, y_train = y_train_full[:5000], y_train_full[5000:]


In [None]:
model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),
  tf.keras.layers.Dense(128, activation='relu'),  # 활성화 함수 선택 예: ReLU
  tf.keras.layers.Dropout(0.5),                   # dropout 선택 예: 0.5
  tf.keras.layers.Dense(10, activation='softmax')
])

## optimizer: sgd, rmsprop, adam
model.compile(optimizer='sgd',                     #최적화 알고리즘 선택 예: SGD
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

In [None]:
History = model.fit(x_train, \
                    y_train, \
                    epochs=5,\
                    validation_data=(x_valid,y_valid))   # 최대 epoch 수 선택 예: 5

print()
print('---------------------------------------')
print('Evaluation 결과: test 데이터 이용')
model.evaluate(x_test,  y_test, verbose=1)

In [None]:
x_new = x_test[:3]
y_prob = model.predict(x_new)

print('예측된 확률: ', y_prob)
print('예측된 확률(반올림): ', y_prob.round(2))
print('실제 값: ', y_test[:3])

# **II. 추가 내용: 계산실험 참고용**
- 학습 과정 및 결과에 대한 이력(history) 검토 가능: __.history 속성
 - 상세: 매 epoch 직후 및 종료 후의 훈련 데이터 관련 정확도(accuracy) 및 손실(loss), 검증 데이터 관련 정확도(val_accuracy) 및 손실(val_loss)
 - 학습과정 및 결과에 대한 이력의 시각화를 위해, __.history 이용 가능

- 구성된 NN 구조 및 최적해 문제의 차원(즉, 손실함수 최소화 과정을 통해 계산되어지는 parameter 수)에 대한 검토 가능: __.summary()

- 학습을 통해 계산되어지는 parameter(가중치 & 편향) 확인 가능: __.get_weights()

In [None]:
History.history

In [None]:
model.summary()    # 검토 or 확인 가능: '구성된 NN 구조' 및 '최적해 문제의 차원(parameter 수)'

In [None]:
# 참고: 훈련/검증/테스트를 위해 사용되는 데이터의 수와 형태
print('x_train shape:', x_train.shape)
print('y_train shape:', y_train.shape)
print('x_valid shape:', x_valid.shape)
print('y_valid shape:', y_valid.shape)
print('x_test shape:', x_test.shape)
print('y_test shape:', y_test.shape)


In [None]:
import matplotlib.pyplot as plt

# 예: 학습모델에서 사용되는 데이터(손글씨 숫자 이미지 파일) 확인 or 시각화
sample_img = x_train[0]
print('label: ', y_train[0])   #해당 이미지파일의 실제 관측값(label)

plt.figure()
plt.imshow(sample_img, cmap='gray')
#plt.imshow(sample_img)
plt.show()



In [None]:
model.layers  #  생성된 층 확인: 학습을 통해 계산되어지는 parameter(가중치 & 편향) 확인을 위한 준비

In [None]:
hiddenL1 = model.layers[1]                 # 확인하고자 하는 층(예: 1st 은닉층)
weights, biases = hiddenL1.get_weights()   # 학습된 가중치
print('weights shape: ', weights.shape)
print('biases shape: ', biases.shape)
print(weights)
print(biases)

In [None]:
## 학습과정 및 결과에 대한 이력 시각화: 예-1
import pandas as pd
import matplotlib.pyplot as plt

pd.DataFrame(History.history).plot(figsize=(8,5))
plt.grid()
plt.gca().set_ylim(0,1)
plt.show()

In [None]:
## 학습과정 및 결과에 대한 이력 시각화: 예-2
import matplotlib.pyplot as plt

# history의 객체 시각화 (정확도, 손실)
plt.figure(figsize=(8,5))
plt.plot(History.history['accuracy'], 'b')
plt.plot(History.history['val_accuracy'], 'r')
plt.plot(History.history['loss'], 'b:')
plt.plot(History.history['val_loss'], 'r:')
plt.title('Model: accuracy and loss')
plt.xlabel('Epoch')
plt.grid()
plt.legend(['acc: Train', 'acc: Valid', 'loss: Train', 'loss: Valid'], loc='upper right')
plt.show()