## 신경망에서 딥러닝으로

#### ▪ 렐루(ReLU) 함수
#### • 시그모이드 함수의 대안으로 떠오르며 현재 가장 많이 사용되는 활성화 함수임
#### • 여러 은닉층을 거치며 곱해지더라도 맨 처음 층까지 사라지지 않고 남아있을 수 있음
#### • 이 간단한 방법이 여러 층을 쌓을 수 있게 했고, 이로써 딥러닝의 발전에 속도가 붙게 됨


#### 고급 경사 하강법에서 현재 가장 많이 사용되는 것은 아담(Adam)
#### 효과는 정확도와 보폭 크기 개선

In [2]:
x = 10
learning_rate = 0.01
precision = 0.00001
max_iterations = 100

# 손실 함수를 람다식으로 정의한다.
loss_func = lambda x: (x-3) ** 2 + 10

# 그래디언트를 람다식으로 정의한다. 손실 함수의 1차 미분값이다.
gradient = lambda x: 2 * x - 6

# 그래디언트 강하법
for i in range(max_iterations):
    x = x - learning_rate * gradient(x)
    print("손실 함수값(", x, ")=", loss_func(x))
    
print("최소값 = ", x)

손실 함수값( 9.86 )= 57.05959999999999
손실 함수값( 9.7228 )= 55.19603983999999
손실 함수값( 9.588344 )= 53.40627666233599
손실 함수값( 9.456577119999999 )= 51.68738810650748
손실 함수값( 9.327445577599999 )= 50.03656753748979
손실 함수값( 9.200896666048 )= 48.45111946300519
손실 함수값( 9.076878732727039 )= 46.92845513227018
손실 함수값( 8.955341158072498 )= 45.46608830903228
손실 함수값( 8.836234334911047 )= 44.061631211994595
손실 함수값( 8.719509648212826 )= 42.7127906159996
손실 함수값( 8.60511945524857 )= 41.41736410760602
손실 함수값( 8.493017066143599 )= 40.17323648894484
손실 함수값( 8.383156724820727 )= 38.97837632398262
손실 함수값( 8.275493590324313 )= 37.830832621552915
손실 함수값( 8.169983718517827 )= 36.728731649739416
손실 함수값( 8.06658404414747 )= 35.67027387640974
손실 함수값( 7.965252363264521 )= 34.65373103090391
손실 함수값( 7.865947315999231 )= 33.67744328208012
손실 함수값( 7.768628369679246 )= 32.73981652810974
손실 함수값( 7.673255802285661 )= 31.839319793596598
손실 함수값( 7.579790686239948 )= 30.97448272977017
손실 함수값( 7.488194872515149 )= 30.143893213671276


In [7]:
import numpy as np

def MSE(y, t):
    return 0.5 * np.sum((y-t) ** 2)

t = np.array([0, 0, 0, 0.5, 0.5, 0, 0, 0, 0, 0])
yr = np.array([0, 0, 0, 0.5, 0.5, 0, 0, 0, 0, 0])
y = np.array([0.01, 0.01, 0.1, 0.3, 0.33, 0.04, 0.02, 0.05, 0.01, 0.1])
y_1 = np.array([0.3, 0.01, 0.1, 0.01, 0.04, 0.02, 0.05, 0.33, 0.01, 0.1])


def CEE(y, t):
    delta = 1e-10
    return -np.sum(t*np.log(y+delta))

print(MSE(t,y))
print(CEE(t, yr))
print(CEE(t,y))
print(CEE(t,y_1))

0.04685
0.6931471803599453
8.265472039806522
21.21844021456322


#### • 입력층과 출력층 사이에 은닉층(hidden layer)을 가지고 있는 신경망을 다층 퍼셉트론(multilayerperceptron: MLP)이라고 부른다.

In [12]:
import tensorflow as tf

batch_size = 128   # 가중치를 변경하기 전에 처리하는 샘플의 개수
num_classes = 10   # 출력 클래스의 개수
epochs = 20   # 에포크의 개수

# 데이터를 학습 데이터와 테스트 데이터로 나눈다.
(x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data()

# 입력이미지를 2차원에서 1차원 벡터로 변경한다.
x_train = x_train.reshape(60000, 784)
x_test = x_test.reshape(10000, 784)

# 입력 이미지의 픽셀 값이 0.0에서 1.0사이의 값이 되게한다.
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')

x_train /= 255
x_test /= 255

# 클래스의 개수에 따라서 하나의 출력 픽셀만이 1이 되게 한다.
# 예를 들면 1 0 0 0 0 0 0 0 0 0과 같다.

y_train = tf.keras.utils.to_categorical(y_train, num_classes)
y_test = tf.keras.utils.to_categorical(y_test, num_classes)

# 신경망의 모델을 구축한다.
model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Dense(512, activation='sigmoid', input_shape=(784,)))
model.add(tf.keras.layers.Dense(num_classes, activation='sigmoid'))
model.summary()
sgd = tf.keras.optimizers.SGD(lr=0.1)

# 손실 함수를 제곱 오차 함수로 설정하고 학습 알고리즘은 SGD 방식으로 한다.
model.compile(loss='mean_squared_error', optimizer=sgd, metrics=['acc'])

# 학습을 수행한다.
history = model.fit(x_train, y_train, batch_size=batch_size, epochs=epochs)

# 학습을 평가한다.
score = model.evaluate(x_test, y_test, verbose=0)
print('테스트 손실값:', score[0])
print('테스트 정확도:', score[1])

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_2 (Dense)              (None, 512)               401920    
_________________________________________________________________
dense_3 (Dense)              (None, 10)                5130      
Total params: 407,050
Trainable params: 407,050
Non-trainable params: 0
_________________________________________________________________
Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20
테스트 손실값: 0.03147835284471512
테스트 정확도: 0.8640000224113464
