In [1]:
"""
분류 문제에서 결괏값이 각 항목이 답이 될 확률로 표시하는 방법.
전체 합은 1
"""
import tensorflow as tf
import numpy as np

# 4개의 변수가 주여지면 3가지 종류 중 하나로 분류
x_data = [[1, 2, 1, 1],
          [2, 1, 3, 2],
          [3, 1, 3, 4],
          [4, 1, 5, 5],
          [1, 7, 5, 5],
          [1, 2, 5, 6],
          [1, 6, 6, 6],
          [1, 7, 7, 7]]

# y 데이터는 one-hot encoding을 처리한 상태다.
y_data = [[0, 0, 1],
          [0, 0, 1],
          [0, 0, 1],
          [0, 1, 0],
          [0, 1, 0],
          [0, 1, 0],
          [1, 0, 0],
          [1, 0, 0]]

# 데이터를 numpy 형태로 변환
x_data = np.asarray(x_data, dtype=np.float32)
y_data = np.asarray(y_data, dtype=np.float32)

nb_classes = 3
"""
만약 y 데이터가 one-hot encodig이 되어 있지 않고 0, 1, 2 이런식으로 데이터가 주어졌다면
y_one_hot = tf.one_hot(list(y_data), nb_classes)
y_one_hot = tf.reshape(y_one_hot, [-1, nb_classes])
이 두 코드로 데이터 전처리를 해준다.
"""

# 임의의 W, b 설정
W = tf.Variable(tf.random.normal((4, nb_classes)), name='weight')
b = tf.Variable(tf.random.normal((nb_classes,)), name='bias')
variables = [W, b]

In [2]:
# Softmax 함수를 tf.nn.softmax()로 구현해줄 수 있다.
def hypothesis(X):
    return tf.nn.softmax(tf.matmul(X, W) + b)

# 우리가 지금까지 쓰던 손실함수. 이를 cross entropy 라고 한다.
def cost_fn(X, Y):
    logits = hypothesis(X)
    cost = -tf.reduce_sum(Y * tf.math.log(logits), axis=1)
    cost_mean = tf.reduce_mean(cost)
    return cost_mean

def grad_fn(X, Y):
    with tf.GradientTape() as tape:
        loss = cost_fn(X, Y)
        grads = tape.gradient(loss, variables)
        return grads

In [3]:
def fit(X, Y, epochs=2000, verbose=100):
    optimizer =  tf.keras.optimizers.SGD(learning_rate=0.1)

    for i in range(epochs):
        grads = grad_fn(X, Y)
        optimizer.apply_gradients(zip(grads, variables))
        if (i==0) | ((i+1)%verbose==0):
            print('Loss at epoch %d: %f' %(i+1, cost_fn(X, Y).numpy()))
            
fit(x_data, y_data)

Loss at epoch 1: 1.781103
Loss at epoch 100: 0.813492
Loss at epoch 200: 0.650811
Loss at epoch 300: 0.576483
Loss at epoch 400: 0.523067
Loss at epoch 500: 0.478316
Loss at epoch 600: 0.438194
Loss at epoch 700: 0.400699
Loss at epoch 800: 0.364465
Loss at epoch 900: 0.328387
Loss at epoch 1000: 0.291736
Loss at epoch 1100: 0.256818
Loss at epoch 1200: 0.238184
Loss at epoch 1300: 0.226397
Loss at epoch 1400: 0.215683
Loss at epoch 1500: 0.205896
Loss at epoch 1600: 0.196922
Loss at epoch 1700: 0.188665
Loss at epoch 1800: 0.181043
Loss at epoch 1900: 0.173988
Loss at epoch 2000: 0.167441
