In [1]:
import os
import warnings
warnings.filterwarnings('ignore')

import numpy as np
import pandas as pd
import tensorflow as tf
import keras as kr

import matplotlib.pyplot as plt
import seaborn as sns

Using TensorFlow backend.


## Chap 3 Loss Function & Optimizer

- loss function : 지도학습은 기본적으로 x와 y가 있다. 
x는 data y를 target이라고 할때에 (x,y)가 학습할 데이터의 수만큼 주어지게 된다. 
그러면 우리가 원하는 것은 설계하고 학습한 모델이 새로운 x를 input시킬때 적당한 y값을 얻고싶다. 
- 하지만 데이터마다 모델을 개별적으로 만든다고 가정하면 weight파라미터는 거의 다 같지 않을 것이다. 이 개별적인 모델은 x와 똑같은 x가 input된다면 y를 오차없이 output할수 있지만 다른 x가 주어진다면 무의미한 모델이 될 것이다.

- 따라서 이런 데이터들을 모두 수용할 수 있는 모델을 만들어야하는데 그렇게 만드는 모델은 개별적 데이터를 input하면 어떤 방식으로든 loss가 발생한다.
- 이 loss를 측정하는 함수를 loss function이라한다.
- 그럼 데이터가 input될때마다 모델의 loss가 발생할텐데 결과적으로 최적의 모델은 이러한 loss들을 최적화(보통 최소화)를 시켜줘야 한다.
- 이 최적화하는 방식 혹은 함수를 optimizer라고 한다.

### Loss Function

In [0]:
((X_train,y_train),(X_test,y_test)) = kr.datasets.mnist.load_data()

In [0]:
sample_train_x = X_train[:10]
sample_train_y = y_train[:10]

In [8]:
sample_train_x.shape

(10, 28, 28)

In [0]:
##  가중치와 편향 설정
w = np.random.randn(784,10)
b = np.random.randn(10,1)

In [0]:
x_input1 = np.reshape(sample_train_x[0],[784,1])

In [48]:
w_t = np.transpose(w)
print(w_t.shape,x_input1.shape,b.shape)

(10, 784) (784, 1) (10, 1)


In [0]:
y_model = np.matmul(w_t,x_input1)+b

In [50]:
y_model.shape

(10, 1)

In [51]:
y_model

array([[-1861.70716254],
       [ 2348.56187416],
       [-2997.82813984],
       [  134.82778455],
       [ -653.81536394],
       [ 2929.27011666],
       [ 2940.7050637 ],
       [-2275.68600013],
       [-2257.34625263],
       [  773.50912783]])

In [0]:
y_hat = np.eye(10)[sample_train_y]

In [0]:
def softmax(x):
    e_x = np.exp(x-np.max(x))
    return e_x/e_x.sum()

In [56]:
softmax(y_model)

array([[0.00000000e+000],
       [6.84661003e-258],
       [0.00000000e+000],
       [0.00000000e+000],
       [0.00000000e+000],
       [1.08108765e-005],
       [9.99989189e-001],
       [0.00000000e+000],
       [0.00000000e+000],
       [0.00000000e+000]])