# Master Pytorch Chapter 3 : Neural Networks
https://9bow.github.io/PyTorch-tutorials-kr-0.3.1/beginner/blitz/neural_networks_tutorial.html

## Neural Networks
- torch.nn 패키지를 이용한다.
- nn은 모델을 정의하고 미분할 때 autograd를 사용한다.
- 숫자 이미지를 분류하는 신경망을 예제로 실습한다.
![nn_example](image/nn_example.png)
- feed-forward-network(입력을 받아 여러 계층을 차례로 전달한 후 최종 출력하는 과정)

## Process of train neural network
1. 학습 가능한 매개변수(or 가중치)를 갖는 신경망을 정의
2. 데이터셋 입력을 반복
3. 입력을 신경망에서 처리(계산)
4. 손실(loss, 정답과 얼마나 다른지)을 계산
5. 변화도(gradiant, 기울기)를 신경망의 매개변수들에게 역으로 전파(역전파)
6. 신경망의 가중치 갱신
![weight_formula](image/weight_formula.png)

## 1. Define Neural Network
1. nn.Conv2d()
 ![conv2d](image/conv2d_explain.png)
 - 입력값의 채널 수는 filter의 개수와 같다.(ex. RGB(3개) = filter 3개)
 - in_channels : 입력값의 채널 수(= filter의 개수)
 - out_chnnels : 출력값의 채널 수(= filter 묶음(입력값의 채널 수)의 개수) 
 
2. nn.Linear()
 ![linear](image/linear_explain.png)
 - Kears의 dense와 같은 역할
 - flatten을 해줘야 적용이 가능함(1차원으로 펴버리기)

In [51]:
import torch
from torch.autograd import Variable
import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        
        self.conv1 = nn.Conv2d(1, 6, 5) # 1 in_channel, 6 out_channel, 5 x 5 filter
        self.conv2 = nn.Conv2d(6, 16, 5)
        
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)
        
    def forward(self, x):
        x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))
        x = F.max_pool2d(F.relu(self.conv2(x)), 2) # 사각형이면 그냥 숫자만 적어도 됨
        x = x.view(-1, self.num_flat_features(x))
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x
    
    def num_flat_features(self, x):
        size = x.size()[1:]
        num_features = 1
        for s in size:
            num_features *= s
        return num_features

net = Net()
print(net)

Net(
  (conv1): Conv2d(1, 6, kernel_size=(5, 5), stride=(1, 1))
  (conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))
  (fc1): Linear(in_features=400, out_features=120, bias=True)
  (fc2): Linear(in_features=120, out_features=84, bias=True)
  (fc3): Linear(in_features=84, out_features=10, bias=True)
)


- forward 함수만 저의하면 backward(변화도를 계산하는 함수)sms autograd를 사용하여<br> 자동으로 정의된다. forward 함수에서는 어떠한 Tensor연산을 사용해도 된다.

### 모델의 학습 가능한 매개변수들 확인
- 매 학습마다 갱신되는 매개변수들(가중치)
- 필터의 사이즈, 개수 등
- channel의 개수
- linear의 노드 개수 등

In [48]:
params = list(net.parameters())
print(len(params))
print(params[0].size())

10
torch.Size([6, 1, 5, 5])


### Note
- 위에서 정의한 신경망(LeNet)의 입력은 32x32다.
- MNIST 데이터셋을 사용하기 위해서는 입력 데이터를 32x32의 크기로 바꿔야한다.

In [59]:
torch.randn(1,1,32,32)

tensor([[[[-0.1530, -0.2315,  0.3958,  ...,  0.1192,  0.1148,  0.5588],
          [ 0.5073,  0.0241, -0.9834,  ..., -0.8436,  0.4634, -0.6591],
          [ 0.0606, -0.2803, -1.5516,  ..., -0.5638, -0.4434,  2.0210],
          ...,
          [ 1.2012, -0.6769, -0.6062,  ...,  1.8109, -0.4125,  1.8415],
          [ 2.7800, -1.1861, -0.5775,  ..., -0.6046, -1.5729,  0.5226],
          [-0.9175, -1.1226, -0.0238,  ..., -0.5195, -0.4093, -0.0698]]]])

In [67]:
input = Variable(torch.randn(1, 1, 32, 32))
output = net(input)
print(output)

tensor([[ 0.1249,  0.0288,  0.0351, -0.0150, -0.0178,  0.1136,  0.0241, -0.0171,
         -0.0882,  0.1407]], grad_fn=<ThAddmmBackward>)


### 역전파
- 모든 매개변수의 변화도 버퍼(gradient buffer)를 0으로 초기화
- 무작위 값으로 역전파

In [69]:
net.zero_grad()
output.backward(torch.randn(1,10))

# Question
### 1. what is super()?
- 클래스가 여러 클래스들에 대해 서로서로 상속을 받은 상태일 때,<br>
최상위 클라스의 생성자가 각각의 클래스에 대해 중복해서 출력되기 때문에<br>
이를 방지하기 위해 최상단 부모 클래스를 한 번만 호출하도록 하는 함수
- 참고http://bluese05.tistory.com/5