# Neural networks

In [2]:
import gzip, pickle, time, torch, os, sys
from torch import nn
from torch.utils.data import DataLoader, Dataset
import numpy as np

### Pytorch를 활용한 Network 정의

- 간단한 Fully-connected neural network 정의

In [3]:
class FCNN(nn.Module):
    # 모델 정의
    def __init__(self, 
                 num_feat,
                 num_output,
                 num_node = 32,
                 num_layer = 4,
                 dropout_rate = 0,
                 batch_norm = False,
        ):
        # nn.Module 초기화
        super(FCNN, self).__init__()
        
        # embedding layer 정의
        self.embed = nn.Sequential(
            nn.Linear(num_feat, num_node), # Linear layer
            nn.ReLU(), # activation function
        )
        
        # hidden layer 정의
        self.hidden = nn.ModuleList()
        for _ in range(num_layer):
            hidden_layer = [] # List 형태로 만든 후 순차적으로 layer 요소 추가
            hidden_layer.append(nn.Linear(num_node, num_node)) 
            hidden_layer.append(nn.ReLU())

            # Layer normalization, gradient가 발산/수렴하는 것을 방지해서 훈련 효율을 높임
            # 둘 중 하나만 사용하면 됨
            if dropout_rate != 0: # Dropout 정의
                hidden_layer.append(nn.Dropout(dropout_rate))
            if batch_norm: # batch normalization 정의
                hidden_layer.append(nn.BatchNorm1d(num_node))
            self.hidden.append(nn.Sequential(*hidden_layer))

        self.output = nn.Linear(num_node, num_output)
    
    # 순방향 함수 정의
    # input x가 들어와서 어떤 연산을 거쳐 output이 될 지 정의하는 함수
    def forward(self, x):
        # embedding layer 통과
        h = self.embed(x)
        # 각 layer를 순차적으로 통과
        for layer in self.hidden:
            h = layer(h)
        # output layer 통과
        out = self.output(h)
        return out

- Convolution neural network 정의

In [57]:
class CNN2D(nn.Module):
    # 모델 정의
    def __init__(self, 
                 in_channel,
                 num_output,
                 out_channel = 32,
                 kernel_size = 4,
                 stride = 1,
                 padding = 0,
                 dilation = 1,
                 num_layer = 3,
                 dropout_rate = 0,
                 batch_norm = False,
        ):
        # nn.Module 초기화
        super(CNN2D, self).__init__()
        self.embed = nn.Sequential(
            nn.Conv2d(in_channel, out_channel, kernel_size, stride, padding, dilation),
            nn.LeakyReLU(0.1)
        )
        # hidden layer 정의
        self.hidden = nn.ModuleList()
        for _ in range(num_layer):
            hidden_layer = [] # List 형태로 만든 후 순차적으로 layer 요소 추가
            hidden_layer.append(nn.Conv2d(out_channel, out_channel, kernel_size, stride, padding, dilation)) 
            hidden_layer.append(nn.LeakyReLU(0.1))

            # Layer normalization, gradient가 발산/수렴하는 것을 방지해서 훈련 효율을 높임
            # 둘 중 하나만 사용하면 됨
            if dropout_rate != 0: # Dropout 정의
                hidden_layer.append(nn.Dropout(dropout_rate))
            if batch_norm: # batch normalization 정의
                hidden_layer.append(nn.BatchNorm2d(out_channel))
            hidden_layer.append(nn.MaxPool2d(2))
            self.hidden.append(nn.Sequential(*hidden_layer))

        self.output = nn.Sequential(
            nn.Flatten(),
            nn.Linear(512, num_output)
        )
    
    # 순방향 함수 정의
    # input x가 들어와서 어떤 연산을 거쳐 output이 될 지 정의하는 함수
    def forward(self, x):
        # embedding layer 통과
        h = self.embed(x)
#        print(h.shape)
        # 각 layer를 순차적으로 통과
        for layer in self.hidden:
            h = layer(h)
#            print(h.shape)
        # output layer 통과
        out = self.output(h)
#        print(out.shape)
        return out

### MNIST dataset 테스트

In [59]:
with gzip.open('')

tensor([[ 1.4088],
        [-0.2545],
        [ 0.2423],
        [ 0.7529],
        [ 0.0350],
        [ 0.6736],
        [ 1.2637],
        [ 1.0439],
        [ 1.6194],
        [ 1.4045],
        [ 2.0430],
        [ 0.6491],
        [ 1.3756],
        [ 0.7202],
        [ 1.4177],
        [ 0.6821],
        [ 0.9159],
        [ 1.4333],
        [ 0.1086],
        [ 0.4882],
        [ 1.5869],
        [-0.1379],
        [ 0.7817],
        [-0.3783],
        [ 0.4409],
        [ 1.8630],
        [ 1.2650],
        [ 1.4413],
        [ 0.6946],
        [ 1.2947],
        [ 0.7333],
        [-0.5676],
        [ 1.0590],
        [ 1.2692],
        [ 0.7956],
        [ 0.4946],
        [-0.1548],
        [ 0.8761],
        [ 1.4045],
        [ 0.4932],
        [ 2.6240],
        [-0.8794],
        [-0.3385],
        [ 0.8274],
        [ 0.1018],
        [ 1.1534],
        [ 2.4967],
        [ 1.4909],
        [ 0.5622],
        [ 2.1603],
        [ 0.6098],
        [ 1.1920],
        [ 0.