# Linear Regression - Ⅰ

In [None]:
import torch
import torch.nn
import numpy as np
import matplotlib.pyplot as plt

## [1] Data
-X , Y 좌표 데이터를 가지고 Linear regression 모델을 만들어 본다

In [None]:
# Toy dataset, 값을 연산하는 기능이 없으므로 numpy로 바꾼 후에 진행
x_train = np.array([[3.3], [4.4], [5.5], [6.1], [6.3], [4.8], 
                    [9.7], [6.2], [7.9], [2.7], [7.2], 
                    [10.1], [5.3], [7.7], [3.1]])

y_train = np.array([[1.7], [1.9], [2.09], [2.1], [1.9], [1.3], 
                    [3.3], [2.5], [2.5], [1.1], [2.7], 
                    [3.4], [1.5], [2.4], [1.3]])

#텐서화
x_train_tensor = torch.FloatTensor(x_train)
y_train_tensor = torch.FloatTensor(y_train)

print(type(x_train_tensor))

In [None]:
# 그래프 그리기
plt.figure()
plt.scatter(x_train, y_train)

## [2] Model

$$ Wnew = Wold - \alpha \nabla W $$

$$ H(x) = Wx + b $$

In [None]:
# Hyper parameters
input_size = 1 #x_traind의 dimension, sample의 수와는 관계 없음
output_size = 1
num_epochs = 50
learning_rate = 0.01 #0~1중에 가정

In [None]:
# Linear Regression Model, 내가 사용할 모델 선언
model = torch.nn.Linear(input_size, output_size)

$$ cost(W, b) = \frac{1}{m} \sum^m_{i=1} \left( H(x^{(i)}) - y^{(i)} \right)^2 $$

In [None]:
# Loss function, Optimizer 정의
criterion = torch.nn.MSELoss()#손실함수에 대한 객체를 만들기, error값이 작아지는 learning mate
optimizer = torch.optim.SGD(model.parameters(), lr= learning_rate) #weight값을 업데이트 시켜나갈 때 어떤 알고리즘이 올지 결정

## [3] Training

In [None]:
# Train the model

for epoch in range(num_epochs): #전체 데이터를 학습을 끝마쳤을 때 1epoch, epochs만큼 반복문 사용, 0~4
    #모델링
    optimizer.zero_grad() #grad값을 0으로 초기화
    
    outputs = model(x_train_tensor) #데이터 값 대입, outputs은 y값에 대한 모델=wx+b
    
    loss = criterion(outputs, y_train_tensor) #H(x)와 실제 데이터 y

    # 학습
    loss.backward() #weight 값의 gradient를 반환
    optimizer.step() #Wnew가 업데이트됨

    # Loss 확인하기, Loss값을 수렴할 때까지 확인
    if (epoch+1) % 2 == 0:
        print (f'Epoch : {epoch+1} , Loss: {loss.item():.2f}') #소수점 2자리까지 loss값 나옴,Loss값이 점점 커진다는 의미는 점점 발산한다는 의미=learning mate값을 줄여야 함,epoch값을 크게 한다.

In [None]:
x_train_plot= torch.FloatTensor(x_train)# x_train이 numpy이므로
predicted = model(x_train_plot).detach().numpy()  # torch.detach().numpy()-->numpy를 텐서로 바꿔줌

plt.figure()
plt.plot(x_train, y_train, 'ro', label='data') # 'ro' --> 빨간색, o 동그라미(circle)를 의미
plt.plot(x_train, predicted, label='linear function')
plt.legend(loc='upper left') # 범례 위치 설정, legend는 그래프를 나타나겠다
plt.show()

### Check

In [None]:
model.state_dict() #parameter값 확인

In [None]:
check_y = 0.4371*x_train -0.6305

plt.figure()
plt.plot(x_train, y_train, 'ro', label='data')
plt.plot(x_train, check_y)
plt.show()