앞서 배운 x가 1개인 선형 회귀를 단순 선형 회귀라고 한다.  
이번 챕터는 다수의 x로부터 y를 예측하는 다중 선형 회귀를 학습한다.

### 1. 데이터에 대한 이해

이제 독립 변수 x의 갯수가 3개라고 해보자.  
즉, h(x) = w1x1 + w2x2 + w3x3

### 2. 파이토치로 구현하기

In [1]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

In [2]:
torch.manual_seed(1)

<torch._C.Generator at 0x1e1bd8570f0>

In [3]:
x1_train = torch.FloatTensor([[[73],[93],[89],[96],[73]]])
x2_train = torch.FloatTensor([[[80],[88],[91],[98],[66]]])
x3_train = torch.FloatTensor([[[75],[93],[90],[100],[70]]])
y_train = torch.FloatTensor([[[152],[185],[180],[196],[142]]])

In [4]:
# 가중치 w와 편향 b 초기화
w1 = torch.zeros(1, requires_grad=True)
w2 = torch.zeros(1, requires_grad=True)
w3 = torch.zeros(1, requires_grad=True)
b = torch.zeros(1, requires_grad=True)

In [None]:
# optimizer 설정
optimizer = optim.SGD([w1,w2,w3,b],lr = 1e-5)

np_epochs = 5000
for epoch in range(np_epochs + 1):

    # H(x) 계산
    hypo = x1_train * w1 + x2_train * w2 + x3_train * w3 + b

    # cost 계산
    cost = torch.mean((hypo - y_train) ** 2)

    # cost로 H(x) 개선
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    # 100번마다 로그 출력
    if epoch % 100 == 0:
        print(f'Epoch {epoch:4d}/{np_epochs:3f} w1: {w1.item():3f}, w2: {w2.item():3f}, w3: {w3.item():3f}, b: {b.item():3f}, Cost: {cost.item():6f}')


### 3. 벡터와 행렬 연산으로 바꾸기

- 자세한 내용은 위키독스 이미지 참조할 것

x의 개수가 1000개라면, 변수를 선언하는데만 엄청난 시간이 걸릴 것.  
이를 위해 행렬 곱셈 연산(벡터의 내적)을 사용한다.

#### 1) 벡터 연산으로 이해하기

#### 2) 행렬 연산으로 이해하기

전체 훈련 데이터의 개수를 셀 수 있는 1개의 단위 : 샘플(sample)  
각 샘플에서 y를 결정하게 하는 각각의 독립 변수 x : 특성(feature)

### 4. 행렬 연산을 고려하여 파이토치로 구현하기

In [None]:
x_train  =  torch.FloatTensor([[73,  80,  75], 
                               [93,  88,  93], 
                               [89,  91,  80], 
                               [96,  98,  100],   
                               [73,  66,  70]])  
y_train  =  torch.FloatTensor([[152],  
                               [185],  
                               [180],  
                               [196],  
                               [142]])

In [11]:
print(x_train.shape)
print(y_train.shape)

torch.Size([5, 3])
torch.Size([5, 1])


In [13]:
# 가중치와 편향 선언
W = torch.zeros((3,1), requires_grad=True)
b = torch.zeros(1, requires_grad=True)

In [14]:
# 가설 설정
hypo = x_train.matmul(W) + b 

In [15]:
x_train  =  torch.FloatTensor([[73,  80,  75], 
                               [93,  88,  93], 
                               [89,  91,  80], 
                               [96,  98,  100],   
                               [73,  66,  70]])  
y_train  =  torch.FloatTensor([[152],  
                               [185],  
                               [180],  
                               [196],  
                               [142]])

# 모델 초기화
W = torch.zeros((3, 1), requires_grad=True)
b = torch.zeros(1, requires_grad=True)

# optimizer 설정
optimizer = optim.SGD([W,b], lr = 1e-5)

nb_epochs = 20
for epoch in range(np_epochs + 1):
    
    # H(x) 계산
    # 편향 b는 브로드캐스팅되어 각 샘플에 더해진다.
    hypo = x_train.matmul(W) + b 

    # cost 계산
    cost = torch.mean((hypo - y_train)**2)

    # cost로 H(x) 개선
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()


    print(f'Epoch {epoch:4d}/{np_epochs:3f} hypothesis: {hypo.squeeze().detach()} Cost: {cost.item()}')

Epoch    0/5000.000000 hypothesis: tensor([0., 0., 0., 0., 0.]) Cost: 29661.80078125
Epoch    1/5000.000000 hypothesis: tensor([66.7178, 80.1701, 76.1025, 86.0194, 61.1565]) Cost: 9537.6943359375
Epoch    2/5000.000000 hypothesis: tensor([104.5421, 125.6208, 119.2478, 134.7862,  95.8280]) Cost: 3069.590087890625
Epoch    3/5000.000000 hypothesis: tensor([125.9858, 151.3882, 143.7087, 162.4333, 115.4844]) Cost: 990.6708984375
Epoch    4/5000.000000 hypothesis: tensor([138.1429, 165.9963, 157.5768, 178.1071, 126.6283]) Cost: 322.4820861816406
Epoch    5/5000.000000 hypothesis: tensor([145.0350, 174.2780, 165.4395, 186.9928, 132.9461]) Cost: 107.7170639038086
Epoch    6/5000.000000 hypothesis: tensor([148.9423, 178.9730, 169.8976, 192.0301, 136.5279]) Cost: 38.687496185302734
Epoch    7/5000.000000 hypothesis: tensor([151.1574, 181.6346, 172.4254, 194.8856, 138.5585]) Cost: 16.499042510986328
Epoch    8/5000.000000 hypothesis: tensor([152.4131, 183.1435, 173.8590, 196.5043, 139.7097]) Cos

In [None]:
#임의의 입력 값에 대한 예측
'''
    with torch.no_grad : 이 블록 안에서 수행되는 모든 연산에 대해 역전파 비활성화. 예측을 할 때는 가중치 업데이트가 불필요, 메모리와 계산 자원 절약을 위해 `torch.no_grad()`를 사용
    '''
with torch.no_grad():
    # 예측하고 싶은 임의의 입력
    # 모델이 학습한 기존 데이터와 동일한 차원
    new_input = torch.FloatTensor([[75,85,52]])
    # W와 b는 업데이트된 가중치와 편향. 위의 학습의 결과이다.
    prediction = new_input.matmul(W) + b
    print(f'Predicted value for input {new_input.squeeze().tolist()} : {prediction.item()}')

IndentationError: unexpected indent (4210238335.py, line 2)