# nn package
pytorch를 사용하면 신경망은 autograd를 이용해 깔끔하게 정의

output = nn.CAddTable():forward({input1, input2})꼴은 output = input1 + input2로,

output = nn.MulConstant(0,5_:forward(input)꼴은 output = input * 0.5로 간단하게 대체

상태(state)는 더이상 모듈에 존재하지 않고, 네트워크 그래프에 존재한다.

RNN을 사용하는 것은 더 간단해짐. 가중치를 공유할 필요 없이 동일한 선형레이어(Linear layer)를 반복적으로 사용하면 간단하게 RNN을 생성할 수 있다

### Ex 1 : ConvNet(CNN)
소규모 CNN을 생성하는 방법

모든 네트워크는 nn.Module 클래스로부터 시작한다.
  - 생성자(constructor)에서 사용하고자 하는 레이어를 모두 선언
  - 전방향 함수(forward function)에서 입력에서 출력까지 모델을 어떻게 진행시킬 것인지 정의

In [1]:
import torch
import torch.nn as nn
import torch.nn.functional as F

class MNISTConvNet(nn.Module):
    
    def __init__(self):
        # 이곳에 모듈을 정의
        super(MNISTConvNet, self).__init__()
        self.conv1 = nn.Conv2d(1, 10, 5)
        self.pool1 = nn.MaxPool2d(2,2)
        self.conv2 = nn.Conv2d(10, 20, 5)
        self.pool2 = nn.MaxPool2d(2, 2)
        self.fc1 = nn.Linear(320, 50)
        self.fc2 = nn.Linear(50, 10)
        
    # 네트워크 구조 정의(forward 함수)
    def forward(self, input):
        x = self.pool1(F.relu(self.conv1(input)))
        x = self.pool2(F.relu(self.conv2(x)))
        
        x = x.view(x.size(0), -1)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        return x
    
net = MNISTConvNet()
print(net)

MNISTConvNet(
  (conv1): Conv2d(1, 10, kernel_size=(5, 5), stride=(1, 1))
  (pool1): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  (conv2): Conv2d(10, 20, kernel_size=(5, 5), stride=(1, 1))
  (pool2): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  (fc1): Linear(in_features=320, out_features=50, bias=True)
  (fc2): Linear(in_features=50, out_features=10, bias=True)
)


torch.nn 은 미니배치만 지원함. torch.nn패키지 모두 미니 배치 형태인 입력만 지원하고, 단일 형태인 입력은 지원하지 않는다.

예를들어 mm.Conv2는 nSamples x nChannels x Height x Width 인 4차원 텐서형태를 취한다.

단일 형태로 사용하려면, input.unsqueeze(0)을 사용하여 가짜 배치차원을 추가해야한다.

In [2]:
# 한개의 랜덤 테이터를 포함하는 미니배치를 생성하고 CNN에 전송한다.
input = torch.randn(1, 1, 28, 28)
out = net(input)
print(out.size())

torch.Size([1, 10])


In [3]:
# dummy target label을 정의하고 손실함수를 사용하여 에러를 계산한다.
target = torch.tensor([3], dtype=torch.long)
loss_fn = nn.CrossEntropyLoss()
err = loss_fn(out, target)
err.backward()

print(err)

tensor(2.3503, grad_fn=<NllLossBackward>)


ConvNet의 출력은 Tensor다. 이를 사용하여 손실(loss)을 계산하고, 결과는 Tensor인 err에 저장.

err에 .backward를 호출하면 CNN의 가중치에 그라디언트가 전파된다.

In [4]:
#개별 레이어 가중치과 그라디언트에 접근
print(net.conv1.weight.grad.size())

torch.Size([10, 1, 5, 5])


In [6]:
print(net.conv1.weight.data.norm()) # 가중치
print(net.conv1.weight.grad.data.norm()) # 그라디언트

tensor(1.7945)
tensor(0.1053)


### Forward and Backward Function Hooks
가중치가 그라디언트를 보았다. 레이어의 출력이나 grad_output을 살펴보거나 변형하기 위해서는? Hook!

우리는 Module이나 Tensor 함수를 등록할 수 있다. 훅은 정방향 훅, 역방향 훅이 있다. 정방향 훅은 forward가 호출될때 역방향 훅은 backward단계에서 실행

conv2에 forward hook을 등록하고 몇가지 정보를 출력해보자

In [10]:
def printgradnorm(self, grad_input, grad_output):
    print('Inside ' + self.__class__.__name__ + ' backward')
    print('Inside class:' + self.__class__.__name__)
    print('')
    print('grad_input : ', type(grad_input))
    print('grad_input[0] : ', type(grad_input[0]))
    print('grad_output : ', type(grad_output))
    print('grad_output[0] : ', type(grad_output[0]))
    print('')
    print('grad_input size : ', grad_input[0].size())
    print('grad_output size', grad_output[0].size())
    print('grad_input norm : ', grad_input[0].norm())
    
net.conv2.register_backward_hook(printgradnorm)

out = net(input)
err = loss_fn(out, target)
err.backward()

Inside Conv2d backward


AttributeError: 'Conv2d' object has no attribute '__class__name'

# Ex2 : Recurrent Net(RNN)
다음으로 Pytorch로 RNN을 만들어보자

네트워크 상태는 레이어가 아닌 그래프에 저장되기 때문에, 우리는 단순하게 nn.Linear를 만들고 이것을 반복적으로 재사용하면 된다.

In [14]:
class RNN(nn.Module):
    
    def __init__(self, datasize, hidden_size, output_size):
        super(RNN, self).__init__()
        
        self. = hidden_size
        input_size data_size + hidden_size
        
        self.i2h = nn.Linear(input_size, hidden_size)
        self.h2o = nn.Linear(hidden_size, output_size)
        
    def forward(self, data, last_hidden):
        input = torch.cat((data, last_hidden), 1)
        hidden = self.i2h(input)
        output = self.h2o(hidden)
        return hidden, output
    
rnn = RNN(50, 20, 10)

SyntaxError: invalid syntax (<ipython-input-14-19639a066b9e>, line 6)