### [ torch.nn Module 활용 ]
--- 
- 신경망 구축하기 위한 다양한 데이터 구조나 레이어, 활성화 함수, 손실 함수 등이 정의된 모듈
- 선형회귀모델 => nn.Linear(입력, 출력)

In [1]:
# 모듈 로딩 ---------------------------------
import torch
import torch.nn as nn
import torch.nn.functional as F

#### [1] 단순 선형 회귀

In [2]:
# 랜덤 시드 설정 ----------------------------
torch.manual_seed(1)

<torch._C.Generator at 0x2b35e5d7230>

In [3]:
# 학습 데이터 준비 --------------------------
x_train=torch.FloatTensor([[1],[2],[3]])
y_train=torch.FloatTensor([[2],[4],[6]])

### 모델 구축 ----------------------------------

In [4]:
# 모델 선언 및 초기화 ---------------------------------------
# 단순 선형 회귀 => nn.Linear( nput_dim=1, output_dim=1)
# 모델 객체 생성 시 랜덤 초기촤 W, B 저장되어 있음 => 확인: model.parameters()
model = nn.Linear(1,1)


In [5]:
# 생성 모델 확인 
print(f'model => {model}')
print(f'BEFORE parameters =>\n{list(model.parameters())}')  # model.named_parameters(): parameter 이름이 같이 출력

model => Linear(in_features=1, out_features=1, bias=True)
BEFORE parameters =>
[Parameter containing:
tensor([[0.5153]], requires_grad=True), Parameter containing:
tensor([-0.4414], requires_grad=True)]


In [6]:
# optimizer 설정 ---------------------------------------
# 경사 하강법 => SGD, learning rate lr : 0.01
# model.parameters() 메서드 통해 W, b 전달 받음
optimizer = torch.optim.SGD(model.parameters(), lr=0.01) 

In [7]:
# 모델 학습 ---------------------------------------------
# 전체 훈련 데이터에 대해 경사 하강법을 2,000회 반복

nb_epochs = 2000

for epoch in range(nb_epochs+1):

    # H(x) 계산 : 학습 데이터에 대한 예측값 
    prediction = model(x_train)

    # cost 계산
    # 파이토치 제공하는 평균 제곱 오차 함수 : mse_loss()
    cost = F.mse_loss(prediction, y_train) 
    
    
    # cost로 H(x) 개선하는 부분
    # gradient를 0으로 초기화
    optimizer.zero_grad()
    
    # 비용 함수를 미분하여 gradient 계산
    cost.backward() # backward 연산
    
    # W와 b를 업데이트
    optimizer.step()
    
    # 100번마다 로그 출력
    if epoch % 100 == 0:
        print(f'Epoch {epoch:4d}/{nb_epochs} Cost: {cost.item():.6f} ')

Epoch    0/2000 Cost: 13.103541 
Epoch  100/2000 Cost: 0.002791 
Epoch  200/2000 Cost: 0.001724 
Epoch  300/2000 Cost: 0.001066 
Epoch  400/2000 Cost: 0.000658 
Epoch  500/2000 Cost: 0.000407 
Epoch  600/2000 Cost: 0.000251 
Epoch  700/2000 Cost: 0.000155 
Epoch  800/2000 Cost: 0.000096 
Epoch  900/2000 Cost: 0.000059 
Epoch 1000/2000 Cost: 0.000037 
Epoch 1100/2000 Cost: 0.000023 
Epoch 1200/2000 Cost: 0.000014 
Epoch 1300/2000 Cost: 0.000009 
Epoch 1400/2000 Cost: 0.000005 
Epoch 1500/2000 Cost: 0.000003 
Epoch 1600/2000 Cost: 0.000002 
Epoch 1700/2000 Cost: 0.000001 
Epoch 1800/2000 Cost: 0.000001 
Epoch 1900/2000 Cost: 0.000000 
Epoch 2000/2000 Cost: 0.000000 


In [8]:
# 학습 완료 후 모델의 W, b
print(f'AFTER parameters =>\n{list(model.parameters())}')
params=list(model.parameters())
for param in params: print(param.item())

AFTER parameters =>
[Parameter containing:
tensor([[1.9994]], requires_grad=True), Parameter containing:
tensor([0.0014], requires_grad=True)]
1.999367117881775
0.001438319799490273


In [9]:
# 예측 --------------------------------------------
# 임의의 입력 4를 선언
new_var =  torch.FloatTensor([[4.0]]) 

# forward 연산
pred_y = model(new_var) 

# y = 2x 이므로 입력이 4라면 y가 8에 가까운 값이 나와야 제대로 학습이 된 것
print("훈련 후 입력이 4일 때의 예측값 :", pred_y) 

훈련 후 입력이 4일 때의 예측값 : tensor([[7.9989]], grad_fn=<AddmmBackward0>)


#### [2] 다중 선형 회귀 모델

In [10]:
# 랜덤 시드 설정 ----------------------------
torch.manual_seed(1)

<torch._C.Generator at 0x2b35e5d7230>

In [11]:
# 데이터
x_train = torch.FloatTensor([[73, 80, 75],
                             [93, 88, 93],
                             [89, 91, 90],
                             [96, 98, 100],
                             [73, 66, 70]])
y_train = torch.FloatTensor([[152], [185], [180], [196], [142]])

In [12]:
# 모델 선언 및 초기화 -----------------------------------------
# 다중 선형 회귀 =>  input_dim=3, output_dim=1
model = nn.Linear(3,1)

In [13]:
# 랜덤 초기화된 W, b 확인
print(f'params : {list(model.parameters())}')

params : [Parameter containing:
tensor([[ 0.2975, -0.2548, -0.1119]], requires_grad=True), Parameter containing:
tensor([0.2710], requires_grad=True)]


In [14]:

optimizer = torch.optim.SGD(model.parameters(), lr=1e-5) 


In [15]:
# 학습 진행 ---------------------------------------------
nb_epochs = 2000
for epoch in range(nb_epochs+1):

    # H(x) 계산
    prediction = model(x_train)
    # model(x_train)은 model.forward(x_train)와 동일함.

    # cost 계산
    cost = F.mse_loss(prediction, y_train) # <== 파이토치에서 제공하는 평균 제곱 오차 함수

    # cost로 H(x) 개선하는 부분
    # gradient를 0으로 초기화
    optimizer.zero_grad()
    # 비용 함수를 미분하여 gradient 계산
    cost.backward()
    # W와 b를 업데이트
    optimizer.step()

    # 100번마다 로그 출력
    if epoch % 100 == 0:
      print(f'Epoch {epoch:4d}/{nb_epochs} Cost: {cost.item():.6f}')

Epoch    0/2000 Cost: 31667.599609


Epoch  100/2000 Cost: 0.225993
Epoch  200/2000 Cost: 0.223911
Epoch  300/2000 Cost: 0.221941
Epoch  400/2000 Cost: 0.220059
Epoch  500/2000 Cost: 0.218271
Epoch  600/2000 Cost: 0.216575
Epoch  700/2000 Cost: 0.214950
Epoch  800/2000 Cost: 0.213413
Epoch  900/2000 Cost: 0.211952
Epoch 1000/2000 Cost: 0.210559
Epoch 1100/2000 Cost: 0.209230
Epoch 1200/2000 Cost: 0.207967
Epoch 1300/2000 Cost: 0.206762
Epoch 1400/2000 Cost: 0.205618
Epoch 1500/2000 Cost: 0.204529
Epoch 1600/2000 Cost: 0.203481
Epoch 1700/2000 Cost: 0.202486
Epoch 1800/2000 Cost: 0.201539
Epoch 1900/2000 Cost: 0.200634
Epoch 2000/2000 Cost: 0.199770


In [16]:
# 예측 --------------------------------------------------------------------
# 임의의 입력 [73, 80, 75] 선언
new_var =  torch.FloatTensor([[73, 80, 75]]) 

# 입력한 값 [73, 80, 75]에 대해서 예측값 y를 리턴받아서 pred_y에 저장
pred_y = model(new_var) 
print("훈련 후 입력이 73, 80, 75일 때의 예측값 :", pred_y.item()) 

훈련 후 입력이 73, 80, 75일 때의 예측값 : 151.23056030273438
