# 01. 선형회귀모델

## 1-1. 단일선형회귀

In [None]:
import torch
import torch.nn as nn
import torch.optim as optim
import matplotlib.pyplot as plt
import numpy as np

In [None]:
# 1. 데이터 생성
x = torch.linspace(0,10,100).view(-1,1) # 입력데이터
y = 3 * x + 2 + torch.randn(100, 1) * 2 # 라벨

# 2. 모델 정의
class LinearRegressionModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = nn.Linear(1,1) # 입력 1개, 출력 1개 노드 생성

    def forward(self, x):
        return self.linear(x)
    
model = LinearRegressionModel()

# 3. 손실함수, 옵티마이저 정의
criterion = nn.MSELoss() # 평균 제곱 오차
# Weight, Bias 포함 / 학습률
optimizer = optim.SGD(model.parameters(), lr=0.01) # 확률적 경사 하강법

# 4. 가중치 업데이트
epochs = 500 # 학습 반복 횟수
losses = []

for epoch in range(epochs):
    optimizer.zero_grad() # 기울기 초기화
    outputs = model(x) # 예측값 계산
    loss = criterion(outputs, y) # 손실 계산
    loss.backward() # 역전파
    optimizer.step() # 가중치 업데이트

    losses.append(loss.item())

    # 100번에 한번씩 로그 출력
    if (epoch + 1) % 100 == 0:
        print(f"Eporch [{epoch+1} / {epochs}], Loss : {loss.item() : .4f}")

# 5. 결과 시각화
plt.figure(figsize=(10,5))

# 손실 감소 그래프
plt.subplot(1, 2, 1)
plt.ylim(0, 5)
plt.plot(losses)
plt.title("Loss over Epochs")
plt.xlabel("Epoch")
plt.ylabel("Loss")
plt.grid()

# 데이터와 예측 결과
plt.subplot(1, 2, 2)
plt.scatter(x.numpy(), y.numpy(), label="Original Data")
plt.plot(x.numpy(), model(x).detach().numpy(), color="r", label="Fitted Line")
plt.title("Linear Regression Fit")
plt.xlabel("x")
plt.ylabel("y")
plt.legend()

plt.show()

print("Model Parameters :")
for name, param in model.named_parameters():
    print(f"{name} : {param.data}")

In [None]:
# 복습

# 1. 입출력 정의
x = torch.linspace(0, 10, 100).view(-1, 1)
y = 0.5 * (x ** 3) + 0.3 * (x ** 2) + torch.randn(100, 1) * 2

# 2. 모델 정의
class LinearRegression(nn.Module):
    def __init__(self):
        super().__init__()
        self.model = nn.Sequential(
            nn.Linear(1,1),
            nn.ReLU(),
            nn.Linear(10,10),
            nn.ReLU(),
            nn.Linear(10,1)
        )

    def forward(self, x):
        return self.model(x)
    
model = LinearRegression()

# 3. 손실함수 정의
criterion = nn.MSELoss() # 평균 제곱 오차

# 4. 가중치 업데이트
optimizer = optim.SGD(model.parameters(), lr=0.00001)
epochs = 2000
losses = []

for epoch in range(epochs):
    optimizer.zero_grad()
    outputs = model(x)
    loss = criterion(outputs, y)
    loss.backward()
    optimizer.step()

    losses.append(loss.item())

    if (epoch + 1) % 100 == 0:
        print(f"Epoch [{epoch + 1} / {epochs}], Loss : {loss.item(): .4f}")

# 5. 결과 시각화
plt.figure(figsize=(10,5))

# 손실 감소 그래프
plt.subplot(1, 2, 1)
# plt.ylim(0, 600)
plt.plot(losses)
plt.title("Loss over Epochs")
plt.xlabel("Epoch")
plt.ylabel("Loss")
plt.grid()

# 데이터와 예측 결과
plt.subplot(1, 2, 2)
plt.scatter(x.numpy(), y.numpy(), label="Original Data")
plt.plot(x.numpy(), model(x).detach().numpy(), color="r", label="Fitted Line")
plt.title("Linear Regression Fit")
plt.xlabel("x")
plt.ylabel("y")
plt.legend()

plt.show()

print("Model Parameters :")
for name, param in model.named_parameters():
    print(f"{name} : {param.data}")

In [None]:
x = torch.linspace(0,10,100).view(-1,1)
y = 3 * x + 2 + torch.randn(100, 1) * 2

# Train / Test set 분리 (8:2로 분리)
num_train = int(len(x) * 0.8)
indices = torch.randperm(len(x))
train_idx, test_idx = indices[:num_train], indices[num_train:]

x_train, y_train = x[train_idx], y[train_idx]
x_test, y_test = x[test_idx], y[test_idx]

class LinearRegressionModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = nn.Linear(1,1)

    def forward(self, x):
        return self.linear(x)
    
model = LinearRegressionModel()

criterion = nn.MSELoss() 
optimizer = optim.SGD(model.parameters(), lr=0.01)

epochs = 500
losses = []

# 트레이닝 데이터로 학습
for epoch in range(epochs):
    optimizer.zero_grad() 
    outputs = model(x_train) 
    loss = criterion(outputs, y_train)
    loss.backward()
    optimizer.step()

    losses.append(loss.item())

    if (epoch + 1) % 100 == 0:
        print(f"Eporch [{epoch+1} / {epochs}], Loss : {loss.item() : .4f}")

# 테스트 데이터 평가
with torch.no_grad():
    test_output = model(x_test)
    test_loss = criterion(test_output, y_test)

print(f"최종 Test Loss : {test_loss.item(): .4f}")

plt.figure(figsize=(10,5))

plt.subplot(1, 2, 1)
plt.plot(losses)
plt.title("Loss over Epochs")
plt.xlabel("Epoch")
plt.ylabel("Loss")
plt.grid()

plt.subplot(1, 2, 2)
plt.scatter(x_train.numpy(), y_train.numpy(), label="Training Data")
plt.scatter(x_test.numpy(), y_test.numpy(), label="Test Data", color="g")
plt.plot(x.numpy(), model(x).detach().numpy(), color="r", label="Fitted Line")
plt.title("Linear Regression Fit")
plt.xlabel("x")
plt.ylabel("y")
plt.legend()

plt.show()

In [None]:
# 실습2. 다중 선형 회귀 구현

# 데이터 정의 (10개 샘플)
X = torch.tensor([[50.0, 25.0, 30.0],
                [10.0, 20.0, 25.0],
                [5.0, 22.0, 30.0],
                [30.0, 26.0, 28.0],
                [40.0, 15.0, 28.0],
                [60.0, 35.0, 40.0],
                [70.0, 30.0, 35.0],
                [20.0, 15.0, 20.0],
                [25.0, 18.0, 22.0],
                [45.0, 28.0, 30.0]], dtype=torch.float32)

y = torch.tensor([[22.1], [10.4], [9.3], [18.5], [12.9], 
                [25.0], [27.5], [13.0], [15.0], [20.5]], dtype=torch.float32)

# 모델 정의
class MultipleLinearRegression(nn.Module):
    def __init__(self):
        super().__init__()
        self.model = nn.Sequential(
            nn.Linear(3, 1)
        )

    def forward(self, X):
        return self.model(X)
    
model = MultipleLinearRegression()

# 손실함수 정의
criterion = nn.MSELoss()

# 가중치 업데이트
optimizer = optim.SGD(model.parameters(), lr=0.0001)
epochs = 1000
losses = []

for epoch in range(epochs):
    optimizer.zero_grad()
    outputs = model(X)
    loss = criterion(outputs, y)
    loss.backward()
    optimizer.step()

    losses.append(loss.item())

    if (epoch + 1) % 100 == 0:
        print(f"Epoch [{epoch+1} / {epochs}], Loss : {loss.item(): .4f}")

# 결과 시각화
plt.figure(figsize=(10,5))

# 손실 감소 그래프
plt.subplot(1, 2, 1)
plt.plot(losses)
plt.title("Training Loss over Epochs")
plt.xlabel("Epoch")
plt.ylabel("Loss")
plt.grid()

# 데이터와 예측 결과
predicted = model(X).detach().numpy()
actual = y.numpy()

plt.subplot(1, 2, 2)
plt.scatter(range(len(actual)), actual, color="b", label="Actual")
plt.scatter(range(len(predicted)), predicted, color="r", label="Predicted")
plt.grid()

plt.title("Actual vs Predicted Sales")
plt.xlabel("Data index")
plt.ylabel("Sales")
plt.legend()

plt.show()

# Weight / Bias 값 출력
# 방법 1
weight = model.model[-1].weight.data
bias = model.model[-1].bias.data
print("\n학습된 모델의 파라미터")
print(f"Weight : {weight}")
print(f"Bias : {bias}")

# 방법 2
model_layer_idx = len(model.model) - 1

params = dict(model.named_parameters())
w = params[f"model.{model_layer_idx}.weight"].data
b = params[f"model.{model_layer_idx}.bias"].data
print(w)
print(b)