### Model 만들기

<ul>
<li>nn.Modeule 클래스를 상속하여 모델 클래스를 정의하는 방법</li>
<ul><li>명시적으로 forward() 메서드를 정의해야 함</li>
</ul>
<li>nn.Seqential 클래스를 사용하여 모델을 정의하는 방법</li>
<ul><li>자동으로 순차적으로 레이어들이 연결되어 순전파 동작이 정의됨</li>
</ul>

In [1]:
# nn.Module 클래스를 상속하여 모델 클래스를 정의하는 방법
import torch
import torch.nn as nn

class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        # 모델의 레이어들을 정의하고 초기화
        # nn.Sequential을 사용하여 레이어들을 조합
        self.layer1 = nn.Linear(784, 256)
        self.relu1 = nn.ReLU()
        self.layer2 = nn.Linear(256, 64)
        self.relu2 = nn.ReLU()
        self.layer3 = nn.Linear(64,10)

    def forward(self, x):
        # 모델의 순전파 동작을 구현
        # nn.Sequential로 정의한 레이어들의 순전파 동작이 자동으로 수행됨
        x = self.layer1(x)
        x = self.relu1(x)
        x = self.layer2(x)
        x = self.relu2(x)
        x = self.layer3(x)

In [3]:
# nn.Sequential 클래스를 사용하여 모델을 정의하는 방법
import torch
import torch.nn as nn

model = nn.Sequential(
    nn.Linear(784, 256),
    nn.ReLU(),
    nn.Linear(256, 64),
    nn.ReLU(),
    nn.Linear(64, 10)
)

#### nn.BatchNorm1d
- Pytorch의 정규화 모듈 - 배치 정규화(입력 데이터를 평균과 표준편차로 정규화 -> 모델이 더 잘 수렴하도록 도움)를 수행하는데 사용
- 1차원 입력에 대해서만 정규화 수행
- 생성자에서 num_features인자를 받음 - 입력 데이터의 채널 수
<br>
<br>
<code>torch.nn.BatchNorm1d(num_features=10)</code>은 10개의 채널을 가지는 입력 데이터에 대해서 배치 정규화를 수행하는 BatchNorm1d 모듈을 생성

<code>torch.nn.BatchNorm1d(num_feature, eps=1e-05, momentum=0.1, affine=True, trach_running_stats=True)</code>
- num_features : 입력 데이터의 채널 수를 지정하는 인자, 반드시 지정
- eps : 분모에 더해지는 작은 값, 0으로 나누는 것을 방지하기 위한 인자(기본값 : 1e-05)
- momentum: 이전 배치의 평균과 분산값을 얼마나 반영할지를 지정한느 인자(기본값 : 0.1)
- affine : 정규화된 값을 확대 및 이동시킬지 여부를 지정하는 인자(기본값 : True)
- trach_running_stats : 배치 정규화의 효과를 추적할지 여부를 지정하는 인자(기본값 : True)

In [None]:
import torch.nn as nn

class Model(nn.Module):
    def __init__(self):
        # 모델은 입력값을 받아 각 층을 거쳐 출력값을 계산산
        super(Model, self).__init__()
        self.fc1 = nn.Linear(100, 50)
        self.bn = nn.BatchNorm1d(num_features = 50) # 은닉층의 출력에 배치 정규화를 적용 -> 학습이 더 잘 일어남
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(50, 10)

    def forward(self, x):
        x = self.fc1(x)
        x = self.bn(x)
        x = self.relu(x)
        x = self.fc2(x)
        return x


##### nn.BatchNorm2d
- Pytorch의 정규화 모듈 - 배치 정규화(입력 데이터를 평균과 표준편차로 정규화 -> 모델이 더 잘 수렴하도록 도움)를 수행하는데 사용
- 2차원 입력에 대한 배치 정규화 수행
<br><br>
<code>torch.nn.BatchNorm2d(num_feature, eps=1e-05, momentum=0.1, affine=True, trach_running_stats=True)</code>
- num_features : 입력 데이터의 채널 수를 지정하는 인자, 반드시 지정
- eps : 분모에 더해지는 작은 값, 0으로 나누는 것을 방지하기 위한 인자(기본값 : 1e-05)
- momentum: 이전 배치의 평균과 분산값을 얼마나 반영할지를 지정한느 인자(기본값 : 0.1)
- affine : 정규화된 값을 확대 및 이동시킬지 여부를 지정하는 인자(기본값 : True)
- trach_running_stats : 배치 정규화의 효과를 추적할지 여부를 지정하는 인자(기본값 : True)

In [None]:
batch_norm2d = nn.BatchNorm2d(num_features = 64)

#### nn.Conv1d : 1차원 컨볼루션 레이어를 정의 - 입력 데이터의 한 방향(주로 시계열 데이터에서는 시간 축)으로 컨볼루션 연산을 수행

<code>torch.nn.Conv1d(in_channels, out_channels, kernel_size, stride = 1, padding = 0, dilation = 1, groups = 1, bias = True, padding_mode = 'zeros')</code>
- in_channels : 입력 데이터의 채널 개수(ex. 입력데이터가 RGB 이미지인 경우 3)
- out_channels : 출력 데이터의 채널 개수(컨볼루션 필터의 개수를 의미), 출력 데이터가 몇 개의 특징 맵으로 변환되는 지를 결정
- kernel_size : 컨볼루션 필터(커널)의 크기(정수/튜플 형태)<ul><li>ex. kernel_size=3은 3개의 연속된 입력 값에 대해 컨볼루션 연산을 수행, kernel_size(3,5)는 3개의 연속된 입력 값에 대해 한 방향으로 5개의 컨볼루션 연산을 수행</li></ul>
- stride : 컨볼루션 필터의 이동 간격(정수/튜플 형태)<ul><li>ex. stride=1은 한 칸씩 이동하면서 컨볼루션 연산을 수행, stride=2는 두 칸씩 이동하면서 컨볼루션 연산을 수행</li></ul>
- padding : 입력 데이터에 대해 가상의 패딩을 추가, 컨볼루션 연산의 경계 효과를 조절(정수/튜플 형태)<ul><li>ex. padding=1은 입력 데이터에 한 칸의 패딩을 추가, padding=(1,2)는 입력 데이터에 한 방향으로 한 칸의 패딩을 추가하고 다른 방향으로 두 칸의 패딩을 추가</li></ul>
- dilation : 컨볼루션 필터 내의 값 사이의 간격을 조절, 더 넓은 영역을 감지(정수/튜플 형태)
- groups : 입력 데이터와 출력 데이터의 채널을 그룹화하여 연산을 수행, 다양한 네트워크 아키텍처를 구성하는데 사용 
- bias : 편향 사용 여부를 결정(기본값 : True)

In [7]:
# 입력 데이터의 크기가 (16, 3, 100)인 1차원 컨볼루션 레이어를 정의하고, 입력 데이터를 생성한 후 컨볼루션 연산을 수행
import torch
import torch.nn as nn

# 입력 데이터의 크기 : (배치 크기, 채널, 시퀀스 길이)
input_size = (16, 3, 100)

# 1차원 컨볼루션 레이어 정의
conv1d = nn.Conv1d(in_channels=3, out_channels=16, kernel_size=3, stride=1, padding=1)

# 입력 데이터 생성
input_data = torch.randn(input_size)

# 컨볼루션 연산 수행
output = conv1d(input_data)

# 출력 데이터의 크기 : (배치 크기, 출력 채널, 출력 시퀀스 길이)
print("Output size : ", output.size())

Output size :  torch.Size([16, 16, 100])


#### nn.Conv2d : 2차원 컨볼루션 레이어를 정의 - 이미지나 2D 데이터의 특징 추출에 주로 사용

<code>torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride = 1, padding = 0, dilation = 1, groups = 1, bias = True)</code>
- in_channels : 입력 데이터의 채널 개수(ex. 입력데이터가 RGB 이미지인 경우 3)
- out_channels : 출력 데이터의 채널 개수(컨볼루션 필터의 개수를 의미), 출력 데이터가 몇 개의 특징 맵으로 변환되는 지를 결정<br>-> 값이 클수록 더 복잡한 특징을 학습할 수 잇지만 모델의 파라미터 수가 증가
- kernel_size : 컨볼루션 필터(커널)의 크기(정수/튜플 형태)<ul><li>ex. kernel_size=3은 3개의 연속된 입력 값에 대해 컨볼루션 연산을 수행, kernel_size(3,5)는 3개의 연속된 입력 값에 대해 한 방향으로 5개의 컨볼루션 연산을 수행</li></ul>
- stride : 컨볼루션 필터의 이동 간격(정수/튜플 형태)<ul><li>ex. stride=1은 한 칸씩 이동하면서 컨볼루션 연산을 수행, stride=2는 두 칸씩 이동하면서 컨볼루션 연산을 수행</li></ul>
- padding : 입력 데이터에 대해 가상의 패딩을 추가, 컨볼루션 연산의 경계 효과를 조절(정수/튜플 형태)<ul><li>ex. padding=1은 입력 데이터에 한 칸의 패딩을 추가, padding=(1,2)는 입력 데이터에 한 방향으로 한 칸의 패딩을 추가하고 다른 방향으로 두 칸의 패딩을 추가</li></ul>
- dilation : 컨볼루션 필터 내의 값 사이의 간격을 조절, 더 넓은 영역을 감지(정수/튜플 형태)
- groups : 입력 데이터와 출력 데이터의 채널을 그룹화하여 연산을 수행, 다양한 네트워크 아키텍처를 구성하는데 사용 <br>값이 크면 채널 간의 관련성을 줄이는 효과
- bias : 편향 사용 여부를 결정(기본값 : True)

In [6]:
# 입력 데이터의 크기가 (64, 3, 32, 32)인 4D 텐서를 입력으로 받아, 3개의 입력 채널을 64개의 출력 채널로 변환하는 컨볼루션 연산을 수행
import torch
import torch.nn as nn

# 입력 데이터의 크기 : (배치 크기, 채널, 높이, 너비)
input_size = (64, 3, 32, 32)

# 1차원 컨볼루션 레이어 정의
conv1d = nn.Conv2d(in_channels=3, out_channels=64, kernel_size=3, stride=1, padding=1)

# 입력 데이터 생성
input_data = torch.randn(input_size)

# 컨볼루션 연산 수행
output = conv1d(input_data)

# 출력 데이터의 크기 : (배치 크기, 출력 채널, 출력 시퀀스 길이)
print("Output size : ", output.size())

Output size :  torch.Size([64, 64, 32, 32])


#### nn.Flatten() : PyTorch의 텐서를 1차원으로 평탄화 -> 다층 퍼셉트론 등의 신경망 레이어에 입력으로 제공 가능

In [None]:
# 크기가 (batch_size, num_channels, height, width)인 4차원 입력 텐서를 평탄화하여 1차원으로 변환
x = torch.randn(batch_size, num_channels, height, width)
flatten = nn.Flatten()
x_flatten = flatten(x)

#### nn.Linear() : 2개의 행렬 가중치와 편향을 학습하며, 입력 텐서를 선형 변환하여 출력 텐서를 생성
<code>nn.Linear(in_features, out_features, bias)</code>
- in_features(int) : 입력 텐서의 크기(차원, 특성의 수)
- out_features(int) : 출력 텐서의 크기(차원, 특성의 수)
- bias(bool, optional) : 편향을 사용할 지 여부(기본값 : True)

In [1]:
import torch
import torch.nn as nn

# 입력 텐서의 크기가 10이고 출력 텐서의 크기가 20인 선형 변환을 수행하는 nn.Linear 모듈 생성
linear = nn.Linear(10, 20)

# 입력 텐서 생성(크기가 10인 벡터)
input_tensor = torch.randn(1, 10)

# 선형 변환 수행(입력 텐서를 출력 텐서로 변환)
output_tensor = linear(input_tensor)

print("Output Tensor : ", input_tensor, "Input Tensor Size: ", input_tensor.size())
print("Output Tensor : ", output_tensor, "Output Tensor Size: ", output_tensor.size())

Output Tensor :  tensor([[ 0.8696,  0.6732, -1.3565,  1.7093, -0.3729, -1.0334,  0.0570,  0.1954,
         -1.5023,  0.9461]]) Input Tensor Size:  torch.Size([1, 10])
Output Tensor :  tensor([[-0.4326, -0.0047,  0.1956, -0.4480, -0.3607, -0.0627,  0.7353,  1.3083,
          1.1976, -0.0391,  0.1911,  0.9823,  0.0405, -0.1028, -0.0911, -0.1596,
          0.2226, -0.8686,  0.0452, -1.0678]], grad_fn=<AddmmBackward0>) Output Tensor Size:  torch.Size([1, 20])


#### nn.MaxPool1d : 1차원(Max Pooling) 최대 풀링 연산을 수행하는 클래스
Max 풀링은 피처 맵(Feature map)의 공간 차원을 줄이는 역할<br>=> 컨볼루션 연산을 통해 추출된 특징들을 압축하고, 불필요한 정보를 줄이는 효과

<code>nn.MaxPool1d(kernel_size, stride, padding)</code>
- kernel_size : 풀링 윈도우의 크기를 나타내는 정수 값 또는 튜플<br>
입력 신호에서 추출할 최대값을 결정하는데 사용
- strid : 풀링 윈도우의 이동 간격을 나타내는 정수 값 또는 튜플<br>
풀링 연산의 겹침(overlapping)을 조절하며, 일반적으로 kernel_size와 같은 값을 사용
- padding : 입력 신호 주위에 추가할 패딩(padding)의 크기를 나타내는 정수 값 또는 튜플<br>패딩은 입력 신호의 경계 부분에서 풀링 윈도우가 넘어갈 때 발생하는 정보 손실을 줄이는 역할(기본값 : 0)

In [2]:
import torch
import torch.nn as nn

# 입력 텐서 생성 (배치 크기: 1, 채널: 1, 시퀀스 길이: 10)
input_tensor = torch.randn(1, 1, 10)

# MaxPool1d 인스턴스 생성
maxpool = nn.MaxPool1d(kernel_size=2, stride=2, padding=0)
# kernel_size를 2로 설정하여 2개의 연속된 값 중 최대 값을 선택하는 최대 풀링을 수행
# stride를 2로 설정하여 폴링 윈도우를 2개의 값씩 이동하며 수행

# 최대 풀링 수행
output_tensor = maxpool(input_tensor)

# 입력 텐서와 출력 텐서의 크기 확인
print("Output Tensor : ", input_tensor, "Input Tensor Size: ", input_tensor.size())
print("Output Tensor : ", output_tensor, "Output Tensor Size: ", output_tensor.size())

Output Tensor :  tensor([[[-0.5552, -0.6663, -0.2032,  0.0165, -1.7833, -0.6803, -0.5553,
          -1.5209, -1.8043,  1.2375]]]) Input Tensor Size:  torch.Size([1, 1, 10])
Output Tensor :  tensor([[[-0.5552,  0.0165, -0.6803, -0.5553,  1.2375]]]) Output Tensor Size:  torch.Size([1, 1, 5])


#### nn.ModuleList : 파이토치에서 사용되는 모듈들을 리스트 형태로 관리하는 클래스
동적으로 모듈들을 추가하거나 삭제 가능<br><br>
nn.ModuleList는 파이토치 모델의 서브 모듈(sub-module)들을 리스트 형태로 정의하고, 해당 리스트를 모델 클래스의 속성으로 사용<br>이렇게 정의된 nn.ModuleList는 자동으로 모델의 파라미터들과 함께 관리되며, 모델의 forward 연산에서 호출 가능

In [3]:
import torch
import torch.nn as nn

class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        self.linears = nn.ModuleList()
        for i in range(5):
            self.linears.append(nn.Linear(10, 20))

    def forward(self, x):
        for layer in self.linears:
            x = layer(x)
        return x

#### nn.ReLU : 파이토치에서 사용되는 ReLU 활성화 함수를 구현한 클래스
<code>nn.ReLU(inplace = False)</code>
- inplace : ReLU함수의 연산을 in-place로 수행 -> 입력 텐서의 원본을 수정, 연산 속도 향상(기본값 : False)

In [4]:
import torch
import torch.nn as nn

# ReLU 레이어 인스턴스화
relu = nn.ReLU()  # inplace=False가 기본값

# ReLU 연산 적용
x = torch.randn(5)
print('x: ',x)
y = relu(x)  # 원본 x는 수정되지 않고, 새로운 텐서 y를 반환
print('after ReLU()')
print('x: ',x)
print('y: ',y)
print('-'*60)

# inplace=True로 설정한 ReLU 연산
x = torch.randn(5)
print('x: ',x)
relu_inplace = nn.ReLU(inplace=True)
y = relu_inplace(x)  # 원본 x가 직접 수정
print('after ReLU(inplace=True)')
print('x: ',x)
print('y: ',y)

x:  tensor([-0.5873,  0.9109, -1.5854, -1.8586,  0.4784])
after ReLU()
x:  tensor([-0.5873,  0.9109, -1.5854, -1.8586,  0.4784])
y:  tensor([0.0000, 0.9109, 0.0000, 0.0000, 0.4784])
------------------------------------------------------------
x:  tensor([-1.2202,  0.7015, -0.9940,  0.7418,  0.4913])
after ReLU(inplace=True)
x:  tensor([0.0000, 0.7015, 0.0000, 0.7418, 0.4913])
y:  tensor([0.0000, 0.7015, 0.0000, 0.7418, 0.4913])


##### nn.LeakyReLU :  ReLU 함수와 유사하지만, 입력값이 음수일 때 기울기를 0이 아닌 작은 값으로 유지 -> "죽은 뉴런(dead neuron)" 문제를 완화
<code>nn.LeakyReLU(negative_slope= , inplace=False)</code>
- negative_slope : 입력값이 음수일 때 사용할 기울기 값을 결정(보통 0.01이나 0.2같이 작은 값, 기본값 : 0.01)
- inplace : ReLU함수의 연산을 in-place로 수행 -> 입력 텐서의 원본을 수정, 연산 속도 향상(기본값 : False)

In [5]:
import torch.nn as nn

class Model(nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.fc1 = nn.Linear(100, 50)
        self.relu = nn.LeakyReLU(negative_slope=0.01)
        self.fc2 = nn.Linear(50, 10)

    def forward(self, x):
        x = self.fc1(x)
        x = self.relu(x)
        x = self.fc2(x)
        return x