###### 3_loss_practice.ipynb

## 손실 함수 (Loss Function)
- 모델의 예측값과 실제값 사이의 차이를 계산하는 함수
- 학습 과정에서 손실을 최소화하는 것이 목표
- 종류
  1. Categorical Crossentropy : 다중 클래스 분류 / softmax 출력과 함께 사용
  2. Binary Crossentropy : 이진 분류 / sigmoid 출력과 함께 사용
  3. Mean Squared Error (MSE) : 회귀 문제 / 연속값 예측

In [5]:
from keras.models import Sequential
from keras.layers import Flatten, Dense

# * 범주형 데이터 인코딩
from keras.utils import to_categorical

# * MNIST 데이터1
# 데이터 준비
from keras.datasets import mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 독립변수(x) 정규화
x_train = x_train / 255.0
x_test = x_test / 255.0
# ---> 한 줄로 표현? x_train, x_test = x_train / 255.0, x_test / 255.0
# set(y_train)
# 종속변수(y) 인코딩 처리 -> 0 ~ 9 사이의 범위의 값으로 구성됨
y_train = to_categorical(y_train, num_classes=10)
y_test = to_categorical(y_test, 10)

loss_functions = ['categorical_crossentropy', 'mean_squared_error']
for loss in loss_functions:
  print(f'* ------- {loss} ------- *')
  # * 모델 정의
  model = Sequential([
    Flatten(input_shape=(28, 28)),
    Dense(128, activation='relu'),
    Dense(64, activation='relu'),
    Dense(10, activation='softmax')
  ])

  # * 컴파일
  model.compile(optimizer='adam', loss=loss, metrics=['accuracy'])

  # * 학습
  model.fit(x_train, y_train, epochs=2, verbose=0)

  # * 평가
  loss, acc = model.evaluate(x_test, y_test)

  print(f' 학습 결과 :: 정확도 - {acc:.4f} / 손실 - {loss:.4f}')

* ------- categorical_crossentropy ------- *


  super().__init__(**kwargs)


[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 804us/step - accuracy: 0.9689 - loss: 0.0988
 학습 결과 :: 정확도 - 0.9689 / 손실 - 0.0988
* ------- mean_squared_error ------- *
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 820us/step - accuracy: 0.9639 - loss: 0.0057
 학습 결과 :: 정확도 - 0.9639 / 손실 - 0.0057


In [12]:
# 회귀용 샘플 데이터
from sklearn.datasets import make_regression
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

x, y = make_regression(n_samples=500, n_features=5, noise=10, random_state=42)

# * 훈련용 / 테스트용 분리 * (8:2)
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=42)

# * 독립변수 -> 표준 스케일링 (StandardScaler)
scaler = StandardScaler()
#  -- 훈련용 데이터 -> 계산 후 스케일링 처리 : fit_transform()
x_train = scaler.fit_transform(x_train)
#  -- 테스트용 데이터 -> 훈련데이터로 계산된 기준으로 스케일링 처리 : transform()
x_test = scaler.transform(x_test)


# * Sequential 모델 정의(생성) - 3개 레이어(2개 은닉층 + 1개 출력층)
#   - 첫번째 레이어: Dense, 32개 뉴런, relu 함수, input_shape=(feature수,)
#   - 두번째 레이어: Dense, 16개 뉴런, relu 함수
#   - 세번째 레이어: Dense, 1개 뉴런
model = Sequential([
  Dense(32, activation='relu', input_shape=(x_train.shape[1],)), # x_train.shape[1] = 5
  Dense(16, activation='relu'),
  Dense(1)
])

# * 컴파일
model.compile(optimizer='adam', loss='mean_squared_error')

# * 학습
model.fit(x_train, y_train, epochs=50, verbose=0)

# * 평가
loss = model.evaluate(x_test, y_test)

print(f' 회귀 테스트 :: loss (MSE) - {loss:.4f}')




  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m4/4[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 5ms/step - loss: 466.4864 
 회귀 테스트 :: loss (MSE) - 466.4864
