In [None]:
# 기본 훈련 루프

# 머신러닝 문제 해결
# 1. 훈련 데이터 얻기
# 2. 모델 정의
# 3. 손실 함수 정의
# 4. 훈련 데이터를 실행해 이상적인 값에서 손실 계싼
# 5. 손실에 대한 기울기를 계산하고 최적화 프로그램을 사용해 데이터에 맞게 변수 조정
# 6. 결과 평가

# 가장 기본적인 머신러닝 문제인 W(가중치) 및 b(바이어스)의 두 가지 변수가 있는 간단한 선형 모델 f(x) = x * W + b 개발


# 데이터
# 지도 학습은 입력(일반적으로 x로 표시)과 출력(y로 표시, 종종 레이블이라고 함)을 사용
# 목표는 입력에서 출력 값을 예측할 수 있도록 쌍을 이룬 입력과 출력에서 학습
# TensorFlow에서 데이터의 각 입력은 거의 항상 텐서로 표현되며(종종 벡터임), 지도 학습에서 출력(또는 예측하려는 값)도 텐서

# 다음은 선을 따라 점에 가우시안(정규 분포) 노이즈를 추가하여 합성된 데이터
import tensorflow as tf
# import matplotlib.pyplot as plt

# colors = plt.rcParams['axes.prop_cycle'].by_key()['color']

# The actual line
# TRUE_W = 3.0
# TRUE_B = 2.0

# NUM_EXAMPLES = 201

# A vector of random x values
# x = tf.linspace(-2, 2, NUM_EXAMPLES)
# x = tf.cast(x, tf.float32)

# def f(x):
#     return x * TRUE_W + TRUE_B

# Generate some noise
# noise = tf.random.normal(shape=[NUM_EXAMPLES])

# y = f(x) + noise

# Plot all the data
# plt.plot(x, y, '.')
# plt.show()

# 텐서는 일반적으로 배치 또는 입력과 출력이 함께 쌓인 그룹의 형태로 수집
# 일괄 처리는 몇 가지 훈련 이점을 제공할 수 있으며, 가속기 및 벡터화된 계산에서 잘 동작
# 데이터세트가 얼마나 작은지 고려할 때 전체 데이터세트를 단일 배치로 처리 가능


# 모델 정의
# tf.Module을 사용해 변수와 계산을 캡슐화
# class MyModel(tf.Module):
#     def __init__(self, **kwargs):
#         super().__init__(**kwargs)
#         # Initialize the weights to '5.0' and the bias to '0.0'
#         # In practice, these should be randomly initialized
#         self.w = tf.Variable(5.0)
#         self.b = tf.Variable(0.0)

#     def __call__(self, x):
#         return self.w * x + self.b

# model = MyModel()

# print("Variables:", model.variables)
# assert model(3.0).numpy() == 15.0

## 손실 함수 정의
# 손실 함수는 주어진 입력에 대한 모델의 출력이 목표 출력과 얼마나 잘 일치하는지 측정
# 목표는 훈련 중 이러한 차이를 최소화하는 것

# This compute a single loss value for an entire batch
# def loss(target_y, predicted_y):
#     return tf.reduce_mean(tf.square(target_y - predicted_y))

# 모델의 예측을 빨간색, 훈련 데이터를 파란색으로 플롯하여 손실값을 시각화
# plt.plot(x, y, '.', label='Data')
# plt.plot(x, f(x), label='Ground truth')
# plt.plot(x, model(x), label='Predictions')
# plt.legend()
# plt.show()

# print("Current loss: %1.6f" % loss(y, model(x)).numpy())

## 훈련 루프 정의
# 훈련 루프는 순서대로 다음 작업을 반복적으로 수행하는 것으로 구성
# 1. 모델을 통해 입력 배치를 전송하여 출력 생성
# 2. 출력을 출력(또는 레이블)과 비교하여 손실 계산
# 3. 그래디언트 테이프를 사용해 그래디언트 찾기
# 4. 해당 그래디언트로 변수 최적화

# 다음은 경사 하강법을 사용한 모델 훈련 방식
# Given a callable model, inputs, outputs, and a learning rate...
# def train(model, x, y, learning_rate):
#     with tf.GradientTape() as tape:
#         # Trainable variables are automatically tracked by GradientTape
#         current_loss = loss(y, model(x))

#     # Use GradientTape to calculate the gradients with respect to W and b
#     dw, db = tape.gradient(current_loss, [model.w, model.b])

#     # Subtract the gradient scaled by the learning rate
#     model.w.assign_sub(learning_rate * dw)
#     model.b.assign_sub(learning_rate * db)

# model = MyModel()

# Collect the history of W-values and b-values to plot later
# weights = []
# biases = []
# epochs = range(10)

# Define a training loop
# def report(model, loss):
#     return f"W = {model.w.numpy():1.2f}, b = {model.b.numpy():1.2f}, loss = {loss:2.5f}"

# def training_loop(model, x, y):
#     for epoch in epochs:
#         # Update the model with the single giant batch
#         train(model, x, y, learning_rate=0.1)

#         # Track this before I update
#         weights.append(model.w.numpy())
#         biases.append(model.b.numpy())
#         current_loss = loss(y, model(x))

#         print(f"Epoch {epoch:2d}:")
#         print("    ", report(model, current_loss))

# 훈련 수행
# current_loss = loss(y, model(x))

# print(f"Starting:")
# print("    ", report(model, current_loss))

# training_loop(model, x, y)

# 시간이 지남에 따른 가중치 전개 양상 시각화
# plt.plot(epochs, weights, label='Weighs', color=colors[0])
# plt.plot(epochs, [TRUE_W] * len(epochs), '--',
#          label='True weight', color=colors[0])
# plt.plot(epochs, biases, label='Bias', color=colors[1])
# plt.plot(epochs, [TRUE_B] * len(epochs), '--',
#          label='True bias', color=colors[1])
# plt.legend()
# plt.show()

# 훈련된 모델 성능 시각화
# plt.plot(x, y, '.', label='Data')
# plt.plot(x, f(x), label='Ground truth')
# plt.plot(x, model(x), label='Predictions')
# plt.legend()
# plt.show()

# print("Current loss: %1.6f" % loss(model(x), y).numpy())


# 같은 해결방법이지만, Keras를 사용한 경우
# tf.keras.Model을 하위 클래스화하면 모델 정의는 정확히 같게 보임
# Keras 모델은 궁극적으로 모듈에서 상속
class MyModelKeras(tf.keras.Model):
    def __init__(self, **kwargs):
        super().__init__(**kwargs)
        self.w = tf.Variable(5.0)
        self.b = tf.Variable(0.0)

    def call(self, x):
        return self.w * x + self.b

# keras_model = MyModelKeras()

# Reuse the training loop with a Keras model
# training_loop(keras_model, x, y)

# You can also save a checkpoint using Keras's built-in support
# keras_model.save_weights("my_checkpoint")

# 모델을 생성할 때마다 새로운 훈련 루프를 작성하는 대신 Keras의 내장 기능을 사용 가능
# Python 훈련 루프를 작성하거나 디버깅하지 않으려는 경우 유용
# Keras의 내장 기능을 사용하려면, model.compile()을 사용하여 매개변수를 설정하고 model.fit()을 사용해 훈련
keras_model = MyModelKeras()

# compile sets the training parameters
keras_model.compile(
    # By default, fit() uses tf.function().
    # You can turn that off for debugging, but it is on now
    run_eagerly=False,

    # Using a built-in optimizer, configuring as an object
    optimizer=tf.keras.optimizers.SGD(learning_rate=0.1),

    # Keras comes with built-in MSE error
    # However, you could use the loss function
    loss=tf.keras.losses.mean_squared_error,
)

# Keras fit 배치 데이터 또는 전체 데이터세트를 NumPy 배열로 예상
# NumPy 배열은 배치로 분할되며, 기본 배치 크기는 32
# 이 경우, 직접 작성한 루프의 동작과 일치시키기 위해 x를 크기 1000의 단일 배치로 전달
print(x.shape[0])
keras_model.fit(x, y, epochs=10, batch_size=1000)

201
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.src.callbacks.History at 0x78b5986d44f0>