<a href="https://colab.research.google.com/github/ii200400/Tensorflow_Tutorial/blob/master/04%20-%20Neural%20Network%20Basic/01_Classification(2_1ver).ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 개요

포유류인지 조류인지 분류하는 간단한 신경망 모델을 구현

In [None]:
%tensorflow_version 2.x
import tensorflow as tf
import numpy as np

TensorFlow 2.x selected.


## 데이터 정의

In [None]:
# [털, 날개]
# 아래의 W와 같은 타입이 아니면 matmul로 행렬 곱셈이 되지않아 float로 지정하였다.
x_data = np.array(
    [[0., 0.], [1., 0.], [1., 1.], [0., 0.], [0., 0.], [0., 1.]], dtype=np.float32)

# [기타, 포유류, 조류]
# 다음과 같은 형식으로 분류를 하는 것을 one-hot 형식 라벨링이라고 한다.
# 해당하는 종류만 1을 가지고 나머지는 모두 0인 인덱스로 표현한다.
y_data = np.array([
    [1, 0, 0],  # 기타
    [0, 1, 0],  # 포유류
    [0, 0, 1],  # 조류
    [1, 0, 0],
    [1, 0, 0],
    [0, 0, 1]
])

## 신경망 모델 구성

### 가중치,편향 정의

In [None]:
# 신경망은 [2, 3]의 크기를 가지며 -1 ~ 1 사이의 랜덤한 값을 넣도록 한다.
# [입력층(특성), 출력층(레이블)] -> [2, 3] 이기 때문이다.
W = tf.Variable(tf.random.uniform([2, 3], -1., 1.))

# 편향은 각 레이어의 출력수로 설정한다.
# 여기에서는 최종 결과값의 분류 갯수인 3이 출력수로 설정된다.
b = tf.Variable(tf.zeros([3]))

### 최적화 함수

In [None]:
# 최적화 방식은 경사하강법으로 한다.
optimizer = tf.optimizers.SGD(learning_rate=0.01)

### 모델 함수와 활성화 함수

In [None]:
# 각 라벨링일 확률을 계산한다.
def model(x):
  # 가중치 W과 편향 b을 적용
  L = tf.add(tf.matmul(x, W), b)

  # 가중치와 편향을 이용해 계산한 결과 값에
  # 텐서플로우에서 기본적으로 제공하는 활성화 함수인 ReLU 함수를 적용한다.
  L = tf.nn.relu(L)

  # 결과값을 전체합이 1인 확률로 만들어주는 활성화 함수인 softmax를 사용하여
  # 출력값을 보기 쉽게 만든다.
  # 예) [8.04, 2.76, -6.52] -> [0.53 0.24 0.23]
  return tf.nn.softmax(L)

### 비용함수

In [None]:
# 신경망을 최적화하기 위한 비용 함수를 작성한다.각 개별 결과에 대한 합을 구한 뒤 평균을 내어 비용을 구한다
# 전체 합이 아닌, 각각의 결과를 구한 뒤 평균을 내는 방식을 사용하기 위해 axis 옵션을 사용한다.
# axis 옵션이 없으면 -1.09 처럼 총합인 스칼라값으로 출력된다.

#        Y         model         Y * tf.log(model)   reduce_sum(axis=1)   reduce_mean
# 예) [[1 0 0]  [[0.1 0.7 0.2]  -> [[-1.0  0    0]  -> [-1.0, -0.09]  ->    -0.545
#     [0 1 0]]  [0.2 0.8 0.0]]     [ 0   -0.09 0]]

# 위의 reduce_mean은 Cross-Entropy(예측값과 실제값 사이의 확률 분포의 차이를 계산한 것) 라고 한다.
# 이 Cross-Entropy 를 비용으로 한다.
def get_cost (predicted_y, y):
  return tf.reduce_mean(-tf.reduce_sum(y * tf.math.log(predicted_y), axis=1))

### 훈련 함수

In [None]:
# GradientTape를 통하여 학습을 진행한다.
def train(x, y):
  with tf.GradientTape() as t:
    cost = get_cost(model(x), y)

  grads = t.gradient(cost, [W, b])
  optimizer.apply_gradients(zip(grads,[W, b]))

  return cost

## 모델 학습 및 테스트

### 모델 학습

In [None]:
# 위에서 구성한 특징과 레이블로 100번의 학습을 진행한다.
for step in range(100):
  cost = train(x_data, y_data)

  # 10번마다 손실값을 출력하도록 한다.
  if (step + 1) % 10 == 0:
    tf.print(cost)

1.08262956
1.07854092
1.07461429
1.07074273
1.06689632
1.06309736
1.05939722
1.05576265
1.0525049
1.05030954


### 모델 테스트

In [None]:
# 결과 확인
# 0: 기타 1: 포유류, 2: 조류

# tf.argmax: 예측값과 실제값의 행렬에서 tf.argmax 를 이용해 가장 큰 값을 가지는 *인덱스*를 가져온다.
# 위의 함수를 사용하여 one-hot 인코딩에서 레이블을 정보를 가져올 수 있다.
# 예) [[0 1 0] [1 0 0]] -> [1 0]
#    [[0.2 0.7 0.1] [0.9 0.1 0.]] -> [1 0]
prediction = tf.argmax(model(x_data), 1)
target = tf.argmax(y_data, 1)
print(prediction)
print(target)

# tf.equal : 두 값이 같으면 True 아니면 False를 반환
is_correct = tf.equal(prediction, target)
accuracy = tf.reduce_mean(tf.cast(is_correct, tf.float32))
print('정확도: %.2f' % (accuracy * 100))

tf.Tensor([2 1 2 2 2 2], shape=(6,), dtype=int64)
tf.Tensor([0 1 2 0 0 2], shape=(6,), dtype=int64)
정확도: 50.00


# 전체 코드

In [None]:
%tensorflow_version 2.x
import tensorflow as tf
import numpy as np

# [털, 날개]
x_data = np.array(
    [[0., 0.], [1., 0.], [1., 1.], [0., 0.], [0., 0.], [0., 1.]], dtype=np.float32)

# [기타, 포유류, 조류]
y_data = np.array([
    [1, 0, 0],  # 기타
    [0, 1, 0],  # 포유류
    [0, 0, 1],  # 조류
    [1, 0, 0],
    [1, 0, 0],
    [0, 0, 1]
])

#########
# 신경망 모델 구성
######

W = tf.Variable(tf.random.uniform([2, 3], -1., 1.))
b = tf.Variable(tf.zeros([3]))

optimizer = tf.optimizers.SGD(learning_rate=0.01)

def model(x):
  L = tf.add(tf.matmul(x, W), b)
  L = tf.nn.relu(L)

  return tf.nn.softmax(L)

def get_cost (predicted_y, y):
  return tf.reduce_mean(-tf.reduce_sum(y * tf.math.log(predicted_y), axis=1))

def train(x, y):
  with tf.GradientTape() as t:
    cost = get_cost(model(x), y)

  grads = t.gradient(cost, [W, b])
  optimizer.apply_gradients(zip(grads,[W, b]))

  return cost

#########
# 신경망 모델 학습
######

for step in range(100):
  cost = train(x_data, y_data)

  if (step + 1) % 10 == 0:
    tf.print(cost)

#########
# 결과 확인
# 0: 기타 1: 포유류, 2: 조류
######

prediction = tf.argmax(model(x_data), 1)
target = tf.argmax(y_data, 1)
print(prediction)
print(target)

is_correct = tf.equal(prediction, target)
accuracy = tf.reduce_mean(tf.cast(is_correct, tf.float32))
print('정확도: %.2f' % (accuracy * 100))

1.06006014
1.05401957
1.0480994
1.04227281
1.036654
1.03102171
1.02560234
1.02025247
1.01497817
1.00982249
tf.Tensor([2 2 2 2 2 2], shape=(6,), dtype=int64)
tf.Tensor([0 1 2 0 0 2], shape=(6,), dtype=int64)
정확도: 33.33
