In [1]:
import torch
import torch.nn as nn

# 1) 재현성
torch.manual_seed(42)

# 2) 예시 데이터 (면적m^2 -> 집값)
#    실제로는 CSV에서 가져오면 되지만, "가장 간단" 버전이라 여기선 직접 만듦
x = torch.tensor([[20.0],
                  [30.0],
                  [40.0],
                  [50.0],
                  [60.0]], dtype=torch.float32)   # (N, 1)

y = torch.tensor([[200.0],
                  [300.0],
                  [410.0],
                  [520.0],
                  [610.0]], dtype=torch.float32)  # (N, 1)  (예: 단위=만원/백만원 등)

# 3) 모델: 선형회귀(1 -> 1)
model = nn.Linear(1, 1)

# 4) 손실/옵티마이저
loss_fn = nn.MSELoss()
opt = torch.optim.SGD(model.parameters(), lr=0.0001)

# 5) 학습
for epoch in range(3000):
    pred = model(x)
    loss = loss_fn(pred, y)

    opt.zero_grad()
    loss.backward()
    opt.step()

# 6) 예측(새 면적에 대해 집값 예측)
with torch.no_grad():
    new_x = torch.tensor([[45.0]], dtype=torch.float32)  # 45m^2
    new_pred = model(new_x)

print("학습된 가중치(w), 바이어스(b):", model.weight.item(), model.bias.item())
print("45m^2 예측 집값:", new_pred.item())


학습된 가중치(w), 바이어스(b): 10.212055206298828 0.4569530785083771
45m^2 예측 집값: 459.9994201660156


In [None]:
#### 문제
# 문제

# 아래는 집의 **면적(area, m²)**과 **방 개수(rooms)**를 이용해 **집값(price)**을 예측하는 회귀 문제입니다.

# 데이터(학습용)

# 독립변수 2개: area, rooms

# 종속변수 1개: price

# area	rooms	price
# 30	1	260
# 40	2	390
# 50	2	450
# 60	3	580
# 70	3	650
# 80	4	780

In [None]:
# PyTorch로 선형회귀 모델을 만들어 위 데이터를 학습하세요.

# 학습 후 아래 입력에 대한 가격을 예측하세요.

# (area=55, rooms=2)
# (area=75, rooms=4)

In [2]:
import torch
import torch.nn as nn

torch.manual_seed(42)

# 1) 데이터: (N, 2)
X = torch.tensor([
    [30.0, 1.0],
    [40.0, 2.0],
    [50.0, 2.0],
    [60.0, 3.0],
    [70.0, 3.0],
    [80.0, 4.0],
], dtype=torch.float32)

# 정답: (N, 1)
y = torch.tensor([
    [260.0],
    [390.0],
    [450.0],
    [580.0],
    [650.0],
    [780.0],
], dtype=torch.float32)

# 2) 모델: 2 -> 1 (선형회귀)
model = nn.Linear(2, 1)

# 3) 손실/최적화
loss_fn = nn.MSELoss()
opt = torch.optim.SGD(model.parameters(), lr=0.0001)

# 4) 학습
for epoch in range(20000):
    pred = model(X)
    loss = loss_fn(pred, y)

    opt.zero_grad()
    loss.backward()
    opt.step()

# 5) 예측
with torch.no_grad():
    test = torch.tensor([
        [55.0, 2.0],
        [75.0, 4.0],
    ], dtype=torch.float32)
    out = model(test)

print("W:", model.weight.data)  # (1,2)
print("b:", model.bias.data)    # (1,)
print("예측값:\n", out)


W: tensor([[ 8.8014, 17.6319]])
b: tensor([-8.3880])
예측값:
 tensor([[510.9518],
        [722.2432]])


In [None]:
# 대략적인 규칙(직관):

# 면적이 커질수록 가격 상승
# 방 개수가 늘면 가격도 추가 상승
# 따라서 예측값은 보통 다음 범위로 나옵니다(학습이 정상이라면 큰 오차 없이 근접):

# (55, 2) → 약 515 전후

# (75, 4) → 약 755 전후

In [5]:
# delivery_time.csv
# 독립변수(2개)
#   distance_km: 배달 거리(km)
#   orders: 동시 처리 주문 수(혼잡도 느낌)
# 종속변수(1개)
#   delivery_min: 배달 소요시간(분)

###############################

# distance_km,orders,delivery_min
# 1,1,18
# 2,1,22
# 2,2,26
# 3,2,30
# 4,2,34
# 4,3,38
# 5,3,42
# 6,3,47
# 6,4,52
# 7,4,56

In [None]:
# 다음 과제를 수행하세요.
  # delivery_time.csv를 읽어옵니다.
  # distance_km, orders로부터 delivery_min을 예측하는 회귀 모델을 PyTorch로 구현합니다.
  # 모델: 선형회귀(Linear 2→1) 로만 구현
  # 손실: MSE
  # 최적화: SGD
  # 학습 후 아래 2개 입력의 배달 시간을 예측하세요.
  #   (distance_km=3.5, orders=2)
  #   (distance_km=6.5, orders=4)

In [11]:
import pandas as pd
import torch
import torch.nn as nn

torch.manual_seed(42)

# CSV 생성(필요 시)
csv_text = """distance_km,orders,delivery_min
1,1,18
2,1,22
2,2,26
3,2,30
4,2,34
4,3,38
5,3,42
6,3,47
6,4,52
7,4,56
"""
with open("delivery_time.csv", "w", encoding="utf-8") as f:
    f.write(csv_text)

df = pd.read_csv("delivery_time.csv")

X = torch.tensor(df[["distance_km", "orders"]].values, dtype=torch.float32)
y = torch.tensor(df[["delivery_min"]].values, dtype=torch.float32)

model = nn.Linear(2, 1)
loss_fn = nn.MSELoss()

# 표준화 안 하면 lr은 보통 더 작게 잡는 게 안전
opt = torch.optim.SGD(model.parameters(), lr=0.005)

for epoch in range(5000):
    pred = model(X)
    loss = loss_fn(pred, y)

    opt.zero_grad()
    loss.backward()
    opt.step()

with torch.no_grad():
    train_mse = loss_fn(model(X), y).item()
    test = torch.tensor([[3.5, 2.0],
                         [6.5, 4.0]], dtype=torch.float32)
    out = model(test)

print("Train MSE:", train_mse)
print("(3.5,2) ->", out[0].item())
print("(6.5,4) ->", out[1].item())


Train MSE: 0.23353023827075958
(3.5,2) -> 32.23768615722656
(6.5,4) -> 53.42889404296875


In [None]:
# 데이터가 “거리↑ + 주문수↑ → 시간↑”로 단순 증가하게 설계되어서, 학습이 정상이라면:
# (3.5km, 2건) 예측값은 대략 30~35분대
# (6.5km, 4건) 예측값은 대략 52~58분대
# 근처가 나오면 흐름상 자연스럽습니다.