<a href="https://colab.research.google.com/github/bjungweapon/mjc.ai.ml/blob/BDU/BDU_%EC%84%A0%ED%98%95%ED%9A%8C%EA%B7%80_%EC%B5%9C%EC%86%8C%EC%9E%90%EC%8A%B9%EB%B2%95_%EA%B2%BD%EC%82%AC%ED%95%98%EA%B0%95%EB%B2%95_%EC%95%A0%EB%8B%88%EB%A9%94%EC%9D%B4%EC%85%98.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Google Colab에서 matplotlib 애니메이션을 보여주기 위한 설정
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.animation import FuncAnimation
from IPython.display import HTML

# 한글 표시를 위한 설정
!pip install koreanize-matplotlib
import koreanize_matplotlib

# 비용 함수와 기울기 정의
def loss(x):
    return x ** 2

def grad(x):
    return 2 * x

# 경사하강법 실행 (이력 저장)
def gradient_descent_path(start, alpha, steps):
    x = start
    x_history = [x]
    for _ in range(steps):
        x -= alpha * grad(x)
        x_history.append(x)
    return x_history

# 설정
start = 10
steps = 50
alphas = [0.01, 0.1, 0.8]
colors = ['blue', 'green', 'red']
paths = [gradient_descent_path(start, alpha, steps) for alpha in alphas]

# X 축과 비용 함수 그리기
x_vals = np.linspace(-12, 12, 400)
y_vals = loss(x_vals)

# 그래프 설정
fig, ax = plt.subplots(figsize=(8, 5))
ax.plot(x_vals, y_vals, 'k--', label='비용 함수 y = x²')
lines = []
points = []

# 각 학습률에 대해 라인과 점 생성
for i, color in enumerate(colors):
    (line,) = ax.plot([], [], color=color, lw=2, label=f'α = {alphas[i]}')
    (point,) = ax.plot([], [], 'o', color=color)
    lines.append(line)
    points.append(point)

ax.set_xlim(-12, 12)
ax.set_ylim(0, 150)
ax.set_title("학습률에 따른 경사하강법 수렴 애니메이션")
ax.set_xlabel("x (파라미터)")
ax.set_ylabel("Loss")
ax.legend()

# 애니메이션 초기화 함수
def init():
    for line, point in zip(lines, points):
        line.set_data([], [])
        point.set_data([], [])
    return lines + points

# 애니메이션 업데이트 함수
def update(frame):
    for path, line, point in zip(paths, lines, points):
        x_data = path[:frame+1]
        y_data = [loss(x) for x in x_data]
        line.set_data(x_data, y_data)
        if len(x_data) > 0:
            point.set_data([x_data[-1]], [y_data[-1]])
    return lines + points

# 애니메이션 생성
ani = FuncAnimation(fig, update, frames=steps, init_func=init,
                    blit=True, interval=800, repeat=False)      #### contro speed

# Colab에서 애니메이션을 보여줌
plt.close()  # 백그라운드 그림 닫기
from IPython.display import display
display(HTML(ani.to_jshtml()))

 최소 자승법의  애니메이션

In [None]:
# 선형회귀 최소 자승법 애니메이션 시각화
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.animation import FuncAnimation
from IPython.display import HTML
import koreanize_matplotlib  # 한글 폰트 설정

# 무작위 데이터 생성 (랜덤 시드 설정으로 재현 가능)
np.random.seed(42)
m = 0.5  # 실제 기울기
b = 2.0  # 실제 y절편
x = np.random.uniform(0, 10, 20)  # 20개의 x 데이터 포인트
y = m * x + b + np.random.normal(0, 1, 20)  # 노이즈가 있는 y 데이터

# 최소 자승법으로 최적의 기울기와 절편 계산
def compute_least_squares(x, y):
    n = len(x)
    mean_x = np.mean(x)
    mean_y = np.mean(y)

    # 최적의 기울기 계산
    numerator = sum((x_i - mean_x) * (y_i - mean_y) for x_i, y_i in zip(x, y))
    denominator = sum((x_i - mean_x) ** 2 for x_i in x)
    m_optimal = numerator / denominator

    # 최적의 y절편 계산
    b_optimal = mean_y - m_optimal * mean_x

    return m_optimal, b_optimal

# 최적의 파라미터 계산
m_opt, b_opt = compute_least_squares(x, y)

# 애니메이션을 위한 기울기와 절편의 변화 범위 설정
m_range = np.linspace(-1, 2, 30)  # 기울기 범위
b_range = np.linspace(-2, 6, 30)  # 절편 범위
m_grid, b_grid = np.meshgrid(m_range, b_range)

# 오차 함수 계산 (MSE)
def compute_mse(m, b, x, y):
    predictions = m * x + b
    return np.mean((predictions - y) ** 2)

# 모든 m, b 조합에 대한 MSE 계산
Z = np.zeros_like(m_grid)
for i in range(len(m_range)):
    for j in range(len(b_range)):
        Z[j, i] = compute_mse(m_grid[j, i], b_grid[j, i], x, y)

# 그래프 설정
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))

# 첫 번째 그래프: 데이터와 회귀선
scatter = ax1.scatter(x, y, color='blue', alpha=0.6, label='데이터 포인트')
line, = ax1.plot([], [], 'r-', label='회귀선')
residual_lines = []
for i in range(len(x)):
    residual, = ax1.plot([], [], 'g--', alpha=0.3)
    residual_lines.append(residual)

ax1.set_xlim(0, 10)
ax1.set_ylim(-2, 12)
ax1.set_xlabel('x')
ax1.set_ylabel('y')
ax1.set_title('선형회귀: 데이터와 회귀선')
ax1.legend()
ax1.grid(True)

# 두 번째 그래프: 파라미터 공간과 MSE 등고선
contour = ax2.contourf(m_grid, b_grid, Z, 50, cmap='viridis')
path, = ax2.plot([], [], 'ro-', linewidth=2)
optimal_point = ax2.scatter(m_opt, b_opt, color='red', s=100, marker='*', label='최적 파라미터')
ax2.set_xlabel('기울기 (m)')
ax2.set_ylabel('y절편 (b)')
ax2.set_title('파라미터 공간에서의 MSE')
fig.colorbar(contour, ax=ax2, label='평균 제곱 오차 (MSE)')
ax2.legend()
ax2.grid(True)

# 탐색 경로 설정 (최적값 근처의 경로)
num_steps = 30
# 시작점: 임의의 m, b 값
m_start, b_start = -0.5, 5.0
# 경로: 시작점에서 최적점으로 천천히 이동
m_path = np.linspace(m_start, m_opt, num_steps)
b_path = np.linspace(b_start, b_opt, num_steps)

# 애니메이션 초기화 함수
def init():
    line.set_data([], [])
    path.set_data([], [])
    for residual in residual_lines:
        residual.set_data([], [])
    return [line, path] + residual_lines

# 애니메이션 업데이트 함수
def update(frame):
    current_m = m_path[frame]
    current_b = b_path[frame]

    # 현재 회귀선 업데이트
    x_line = np.array([0, 10])
    y_line = current_m * x_line + current_b
    line.set_data(x_line, y_line)

    # 파라미터 경로 업데이트
    path.set_data(m_path[:frame+1], b_path[:frame+1])

    # 잔차 선 업데이트
    y_pred = current_m * x + current_b
    for i, residual in enumerate(residual_lines):
        residual.set_data([x[i], x[i]], [y[i], y_pred[i]])

    return [line, path] + residual_lines

# 애니메이션 생성
ani = FuncAnimation(fig, update, frames=num_steps, init_func=init,
                   blit=True, interval=300, repeat=False)

# Colab에서 애니메이션 표시
plt.close()  # 백그라운드 그림 닫기
from IPython.display import display
display(HTML(ani.to_jshtml()))

이 애니메이션은 다음 두 가지를 시각화합니다:

왼쪽 그래프: 데이터 포인트와 변화하는 회귀선을 보여줍니다. 초록색 점선은 각 데이터 포인트와 예측값 사이의 잔차(오차)를 나타냅니다.
오른쪽 그래프: 기울기(m)와 절편(b)으로 구성된 파라미터 공간에서 MSE(평균 제곱 오차)를 등고선으로 표시하고, 파라미터가 최적값으로 수렴하는 경로를 빨간색 선으로 보여줍니다.

애니메이션 속도는 interval=300으로 설정되어 있으며, 필요에 따라 조정할 수 있습니다.
이 코드를 Google Colab에서 실행하면 최소 자승법의 작동 원리를 시각적으로 이해할 수 있는 애니메이션이 표시됩니다. 특히 파라미터 공간에서 오차가 최소가 되는 지점으로 수렴하는 과정과 그에 따라 회귀선이 데이터에 가장 잘 맞는 직선으로 조정되는 과정을 볼 수 있습니다.
