In [3]:
import tensorflow as tf



In [1]:
import numpy as np
import pandas as pd

In [2]:
import matplotlib.pyplot as plt

### Tensorflow 2.0 사용해보기

#### 데이터 불러오기

In [5]:
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0 , x_test / 255.0

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


#### 네트워크 구조 정의

In [6]:
model = tf.keras.models.Sequential([tf.keras.layers.Flatten(input_shape=(28,28)), tf.keras.layers.Dense(128, activation='relu'),
tf.keras.layers.Dropout(0.2),
tf.keras.layers.Dense(10, activation='softmax')])

#### Keras 모델 Compile

In [11]:
model.compile(optimizer='adam', 
loss = 'sparse_categorical_crossentropy',
metrics=['accuracy'])

#### 학습 수행

In [12]:
model.fit(x_train, y_train, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x124025d30>

### 학습 결과 테스트

In [13]:
model.evaluate(x_test, y_test)



[0.09036891162395477, 0.9732000231742859]

- 97.32%의 정확도를 보임.

<br>
<br>
<br>

### 활성함수
- 퍼셉트론의 출력에 의미를 부여해주며, 일반적으로 비선형함수이다.

### Tanh와 Soft decision
- 값이 작아질 수록 -1, 커질 수록 1에 수렴
- 모든 실수 입력 값에 대해 출력이 정의됨.
- 출력이 실수 값으로, Soft decision
- 입력 값이 0에 가까울 수록 출력이 빠르게 변함.
- 모든 점에서 미분 가능

### Sigmoid function
- 값이 작아질 수록 0, 커질 수록 1에 수렴
- 모든 실수 입력 값에 대해 출력이 정의됨.
- 출력이 0~1 사이로, '확률'을 표현할 수 있음.
- 입력 값이 0에 가까울 수록 출력이 빠르게 변함.
- 모든 점에서 미분 가능
    > Sigmoid 함수는 본래 S-Shape의 함수 모두를 가르킴.

### Softmax function
- 각 입력의 지수함수를 정규화한 것 -> 총합이 1이 되는 것.
- 각 출력은 0~1 사이의 값을 가짐
- 모든 출력의 합이 반드시 1이 됨
- 여러 경우의 수 중 한가지에 속할 '확률'을 표현
    > Softmax는 최종 출력 단에서 N가지 범주로 분류하는 Multi-class classification에 쓰임.

### ReLU
- 0보다 작은 값을 0으로 강제하는 함수
- 딥러닝에서 가장 많이 사용됨.
- 미분 값이 일정(0 또는 1)해서 학습이 잘 되는 특성
- 단순한 구현으로 매우 빠른 연산이 가능

### 손실 함수
- 최적화 이론에서 최소화하고자 하는 함수
- 알고리즘 학습 중 아직 '얼마나 못 하는지' 표현
- 보통 미분 가능한 함수를 사용.
- 목적 함수, 비용 함수, 에너지 함수 등으로 불림.

1) MSE : 평균제곱오차
    > 가장 기본적인 손실 함수. 오차가 커질 수록 손실함수가 빠르게 증가하는 특징이 있으며, 
    회귀에서 많이 쓰임.

2) MAE : 평균절대오차
    > 오차가 커져도 손실함수가 일정하게 증가하는 특징이 있다. Outlier에 강건한 특징이 있다. 
    통계적으로 중간 값과 연관이 있으며 회귀에 많이 쓰임.

3) 원-핫 인코딩
    > 다중 클래스 분류 문제의 정답을 표기할 때 사용. 정답 벡터의 각 인덱스 별로 클래스를 미리 정의하고, 
    정답에 해당하는 요소만 1로 표현, 이러한 정답 벡터를 Label이라부름.

4) CCE : 교차 엔트로피 오차
    > 원-핫 인코딩으로 인해, 정답인 클래스에 대해서만 오차를 계산. 
    정확히 맞추면 오차가 0, 틀릴 수록 오차가 무한히 증가하는 특징이 있다.

# 신경망 구조
- 뉴런을 기본 단위로 하며, 이를 조합하여 복잡한 구조를 이룸.
- 보통 신경망을 표현할 때, Graph의 Node와 Edge를 이용해 표현한다.
    > Node는 단일 뉴런 연산을, Edge는 뉴런의 연결성을 의미한다.

### Fully-Connected Layer(FCN) : 전결합계층
- 두 계층 간의 모든 뉴런이 연결되어 있는 계층을 뜻함.

### 얕은 신경망 (Shallow Neural Network)
- 입력 계층, 은닉 계층, 출력 계층으로 이루어진 신경망
- 심층 신경망의 등장 이후 기존의 신경망은 '얕은' 신경망으로 부름.
- 각 계층은 Fully-connected layer로 이루어져 있음.

### 심층 신경망 (DNN)
- 얕은 신경망보다 은닉 계층이 많은 신경망
- 보통 5개 이상의 계층이 있는 경우 '깊다' (Deep 하다) 라고 표현.

# Perceptron 구현해보기 (OR 함수)

In [23]:
class Perceptron:
    def __init__(self, w, b): # weight, bias
        self.w = tf.Variable(w, dtype=tf.float32)
        self.b = tf.Variable(b, dtype=tf.float32)

    def __call__(self, x): # perceptron을 통과했을 때 어떤 출력이 나오는지
        return tf.sign(tf.reduce_sum(self.w * x) + self.b)

### Utility 함수 구현

In [24]:
# *args에 알아서 Tuple 형태로 들어오게 되고, np.array로 매번 입력할 필요 없음.
def v(*args):
    return np.array(args)

### Perceptron 정의 - weight, bias

In [25]:
w = v(1, 1)
b = 0.5

perceptron = Perceptron(w, b)

### Perceptron 동작 확인

In [26]:
p1 = perceptron(v(1, 1)) # 1사분면 / T, T
p2 = perceptron(v(-1, 1)) # 2사분면 / F, T
p3 = perceptron(v(-1, -1)) # 3사분면 / F, F
p4 = perceptron(v(1, -1)) # 4사분면 / T, F

print(p2.numpy(), p1.numpy())
print(p3.numpy(), p4.numpy())

1.0 1.0
-1.0 1.0


# Perceptron 구현해보기 (XOR 함수)

### Perceptron 정의

In [29]:
p_nand = Perceptron(w=v(-1, -1), b= 0.5)

p_or = Perceptron(w=v(1, 1), b=0.5)

p_and = Perceptron(w=v(1, 1), b=-0.5)

def xor(x):
    h1 = p_nand(x)
    h2 = p_or(x)
    return p_and(v(h1, h2))

### Perceptron 동작확인

In [30]:
p1 = xor(v(1, 1)) # 1사분면 / T, T
p2 = xor(v(-1, 1)) # 2사분면 / F, T
p3 = xor(v(-1, -1)) # 3사분면 / F, F
p4 = xor(v(1, -1)) # 4사분면 / T, F

print(p2.numpy(), p1.numpy())
print(p3.numpy(), p4.numpy())

1.0 -1.0
-1.0 1.0
