# Nerual network
---
<span style="font-size:17px; font-weight:bold">활성화 함수</span>
<br>
<div>
  <ul>
   <p>어떤 신호를 입력 받아 적절한 처리를 하고 출력하는 함수</p>
   <p>딥러닝에서 노드에 입력된 값들을 비선형 활성화 함수에 통과시킨 후 다음 레이어로 전달</p>
   <p>비선형 함수를 쓰는 이유는 딥러닝 모델의 층을 깊게 할 수 있기 때문</p>
      <p> 활성화 함수의 종류로는 <span style="color:blue"> step, sigmoid, relu, softmax</span>등 존재</p>
  </ul>
</div>
<br>

```
1) Step function
    - 각 부분구간에서 상수로 불연속적인 함수
```
<img src="img/step_function.PNG" width="230px"></img>


```
2) Sigmoid function
    - 항상 0과 1사이의 값만 가질 수 있는 비선형 함수
    - 로지스틱 회귀분석에서 사용
```
<img src="img/sigmoid_function.PNG" width="230px"></img>

```
3) Relu function
    - 가장 많이 사용되는 활성화 함수 중 하나
    - Gradient Vanishing 문제를 해결하기 위한 함수
```
<span style="color:red">Gradient Vanishing : sigmoid 함수는 0과 1 사이의 출력값을 가질때 결국 0에 매운 가까운 값으로 수렴 </span> 
<img src="img/relu_function.PNG" width="230px"></img>


```
4) Leaky Relu function
    - ReLU가 갖는 Dying ReLU(뉴런이 죽는 현상) 을 해결하기 위해 나온 함수
    - 0.01이 아니라 매우 작은 값이라면 무엇이든 사용 가능
```
<img src="img/leaky_relu_function.PNG" width="230px"></img>


```
5) Softmax function
    - 다중 클래스 분류 모델을 만들 때 사용
    - 결과를 확률로 해석할 수 있게 변환해주는 함수로 높은 확률을 가지는 class로 분류
```
<br>
<span style="font-size:17px; font-weight:bold">단층 퍼셉트론</span>
<br>
<div>
  <ul>
   <p>다수의 신호를 입력으로 받아 하나의 신호를 출력</p>
   <p>가중치와 편향을 매개변수로 설정</p>
   <p>입력층과 출력층만 존재</p>
   <p>가중치를 가지는 층이 한 층이기 때문에 단층 퍼셉트론이라고 함</p>
   <p style="color:blue">직선형 영역만 표현 가능</p>
   <p style="color:blue">XOR연산 불가능</p>
  </ul>
</div>
<br>

<span style="font-size:17px; font-weight:bold">다층 퍼셉트론</span>
<br>
<div>
  <ul>
   <p>입력층과 출력층을 제외하고 은닉층이 존재</p>
   <p>선형분류만으로 풀지 못 했던 문제를 비선형 문제로 풀 수 잇음</p>
   <p>오차역전파 알고리즘을 통해 오차를 업데이트</p>
  </ul>
</div>
<br>

In [28]:
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

fashion_mnist = tf.keras.datasets.fashion_mnist

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

In [29]:
# 이미지의 픽셀 값을 0~1 사이로 변경
train_images = train_images / 255.0
test_images = test_images / 255.0

In [30]:
# 각 레이블 시각화
# plt.figure(figsize=(10,10))
# for i in range(25):
#     plt.subplot(5,5,i+1)
#     plt.xticks([])
#     plt.yticks([])
#     plt.grid(False)
#     plt.imshow(train_images[i], cmap=plt.cm.binary)
#     plt.xlabel(class_names[train_labels[i]])
# plt.show()

In [31]:
# 모델 생성
model = tf.keras.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(10)
])

model.compile(optimizer='adam', loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True), metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=10)
test_loss, test_acc = model.evaluate(test_images,  test_labels, verbose=2)

print('\nTest accuracy:', test_acc)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
313/313 - 0s - loss: 0.3408 - accuracy: 0.8803 - 362ms/epoch - 1ms/step

Test accuracy: 0.880299985408783


In [32]:
probability_model = tf.keras.Sequential([model, 
                                         tf.keras.layers.Softmax()])

predictions = probability_model.predict(test_images)
print(np.argmax(predictions[0]), test_labels[0])

9 9
