# Neural Network with 2D Data

## 1. Import Required Libraries

In [5]:
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.init as init
from torch.autograd import Variable
from collections import OrderedDict #이건 Python collections 임

# 2. Data Generation

In [6]:
num_data = 1000
num_epochs = 10000

x = init.uniform_(torch.Tensor(num_data, 1), -10, 10)
y = init.uniform_(torch.Tensor(num_data, 1), -10, 10)
z = x**2 + y**2

x_noise = init.normal_(torch.FloatTensor(num_data, 1), std=0.5)
y_noise = init.normal_(torch.FloatTensor(num_data, 1), std=0.5)
z_noise = x_noise**2 + y_noise**2

data_noise = torch.cat([x, y, z_noise], 1)

# 3. Model & Optimizer

In [7]:
class Model(nn.Module):
    def __init__(self, input_dim=2, output_num=1):
        super(Model, self).__init__()
        
        self.model = nn.Sequential(OrderedDict([
            ("fc1", nn.Linear(input_dim, 20)), #Linear 모델 (in_features, out_features, bias=True)
            ("relu1", nn.ReLU()),
            ("fc2", nn.Linear(20, 10)), 
            ("relu2", nn.ReLU()),
            ("fc3", nn.Linear(10, 5)), 
            ("relu3", nn.ReLU()),
            ("fc4", nn.Linear(5, 5)), 
            ("relu4", nn.ReLU()),
            ("fc5", nn.Linear(5, output_num)), 
        ]))
        #Sequential는 컨테이너로 순서대로 추가된다. 여러 개의 레이어를 합쳐 하나의 이름으로 묶을 수 있다.
        #OrderedDict를 사용하면, 개별 레이어와 작업의 이름을 지정해 줄 수 있다. 딕셔너리이므로 key가 중복되어선 안된다.
        #https://pytorch.org/docs/master/nn.html#torch.nn.Sequential
        
        #activate function이 없으면, neural network라도 linear하게 결과를 낼 수 밖에 없다.
        #여기 예에서는 activate function이 없으면, 2차원 함수라도 1차원으로 선을 그어 판단하게 된다.
        #하지만, activate function이 추가되면, 데이터의 분포에 맞춰 곡선으로 그어질 수 있다.
        #Relu 없이 학습해보면 loss 차이를 확인해 볼 수 있다.
        
    def forward(self, x): #x가 Tensor
        return self.model(x)
    
#     def forward(self, x):
#         x1 = self.model(x[0])
#         x2 = self.model(x[1])
#         x = torch.cat((x1, x2), 1)
#         return x
    
model = Model()

# 4. Train

In [8]:
l_rate = 0.001
criterion = nn.L1Loss() #손실함수
optimizer = optim.SGD(model.parameters(), lr=l_rate) #parameters() 메서드로 해당 객체(모델)의 모든 파라미터를 가져온다.

input_data = torch.cat([x, y], 1)

for i in range(num_epochs):
    optimizer.zero_grad() #optimiser.step으로 업데이트된 그라디언트 값들을 초기화해 줘야 한다.
    #이 코드가 없으면, 그라디언트 값들이 누적되어서 제대로 학습되지 않는다.
    outputs = model.forward(input_data) #학습
    loss = criterion(outputs, z_noise) #예측한 값과, 정답
    loss.backward() #역전파 해 준다.
    optimizer.step() #변수 업데이트
    
    if i % 1000 == 0:
        print("epoch {}, \tloss {}".format(i, loss)) #1000번 마다 손실 출력
        
#원래는 Tensor 값인 x, y를 Variable로 변환해서 traininig 해야 했지만, 4.0 부터는 Tensor 그대로 넣어도 된다.

epoch 0, 	loss 0.9987856149673462
epoch 1000, 	loss 0.3502397835254669
epoch 2000, 	loss 0.34771111607551575
epoch 3000, 	loss 0.34680017828941345
epoch 4000, 	loss 0.34619948267936707
epoch 5000, 	loss 0.3457992970943451
epoch 6000, 	loss 0.34551870822906494
epoch 7000, 	loss 0.3453119397163391
epoch 8000, 	loss 0.345132976770401
epoch 9000, 	loss 0.34495919942855835
