# 활성화 함수

## 소프트맥스 함수 구현

In [2]:
import torch

In [3]:
class Net(torch.nn.Module):
  def __init__(self, n_feature, n_hidden, n_output):
    super(Net, self).__init__()
    self.hidden=torch.nn.Linear(n_feature, n_hidden) ## 은닉층
    self.relu=torch.nn.ReLu(inplace=True)
    self.out=torch.nn.Linear(n_hidden, n_output) ## 출력층
    self.softmax=torch.nn.Softmax(dim=n_output)
  def forward(self, x):
    x=self.hidden(x)
    x=self.relu(x) ## 은닉층을 위한 렐루 활성화 함수
    x=self.out(x)
    x=self.softmax(x) ## 출력층을 위한 소프트맥스 활성화 함수
    return x

# 손실 함수

## 평균 제곱 오차

In [11]:
import torch
import torch.nn as nn

class LinearRegression(nn.Module):
    def __init__(self, input_size, output_size):
        super(LinearRegression, self).__init__()
        self.linear = nn.Linear(input_size, output_size)

    def forward(self, x):
        return self.linear(x)

# 입력 크기와 출력 크기 정의
input_size = 1
output_size = 1

model = LinearRegression(input_size, output_size)

loss_fn=torch.nn.MSELoss(reduction='sum')

# 예시 입력 데이터 (x)와 실제값 (y)
x = torch.tensor([[1.0], [2.0], [3.0]], dtype=torch.float32)  # 입력 데이터
y = torch.tensor([[2.0], [4.0], [6.0]], dtype=torch.float32)  # 실제 값 (정답)

y_pred=model(x)
loss=loss_fn(y_pred, y)

## 크로스 엔트로피 오차

In [13]:
loss=nn.CrossEntropyLoss()
input=torch.randn(5, 6, requires_grad=True) ## torch.randn은 평균이 0이고 표준편차가 1인 가우시안 정규분포를 이용하여 숫자를 생성
target=torch.empty(5, dtype=torch.long).random_(6) ## torch.empty는 dtype torch.float32의 랜덤한 값으로 채워진 텐서를 반환
output=loss(input, target)
output.backward()

드롭아웃 구현 : 과적합 문제 해결

In [15]:
class DropoutModel(torch.nn.Module):
  def __init__(self):
    super(DropoutModel, self).__init__()
    self.layer1=torch.nn.Linear(784, 1200)
    self.dropout1=torch.nn.Dropout(0.5)
    self.layer2=torch.nn.Linear(1200, 1200)
    self.dropout2=torch.nn.Dropout(0.5)
    self.layer3=torch.nn.Linear(1200, 10)

  def forward(self, x):
    x=F.relu(self.layer1(x))
    x=self.dropout1(x)
    x=F.relu(self.layer2(x))
    x=self.dropout2(x)
    return self.layer3(x)

# 경사 하강법

## 미니 배치 경사 하강법

In [18]:
from torch.utils.data import Dataset, DataLoader

class CustomDataset(Dataset):
  def __init__(self):
    self.x_data=[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
    self.y_data=[[12], [18], [11]]
  def __len__(self):
    return len(self.x_data)
  def __getitem__(self, idx):
    x=torch.FloatTensor(self.x_data[idx])
    y=torch.FloatTensro(self.y_data[idx])
    return x, y

dataset=CustomDataset()
dataloader=DataLoader(
    dataset, ## 데이터셋
    batch_size=2, ## 미니 배치 크기로 2의 제곱수를 사용하겠다는 의미이다.
    shuffle=True, ## 데이터를 불러올 때마다 랜덤으로 섞어서 가져온다.
)

# 옵티마이저
* 속도를 조정하는 방법

1. 아다그라드

In [19]:
optimizer=torch.optim.Adagrad(model.parameters(), lr=0.01) ## 학습률 기본값은 1e-2

2. 아다델타

In [20]:
optimizer=torch.optim.Adadelta(model.parameters(), lr=1.0) ## 학습률 기본값은 1.0

3. 알엠에스프롭

In [21]:
optimizer=torch.optim.RMSprop(model.parameters(), lr=0.01) ## 학습률 기본값은 1e-2

* 운동량을 조절하는 방법

1. 모멘텀

In [22]:
optimizer=torch.optim.SGD(model.parameters(), lr=0.01, momentum=0.9)

2. 네스테로프 모멘텀

In [23]:
optimizer=torch.optim.SGD(model.parameters(), lr=0.01, momentum=0.9, nesterov=True) ## nesterov 기본값은 False

* 속도와 운동량에 대한 혼용 방법 : 아담

In [24]:
optimizer=torch.optim.Adam(model.parameters(), lr=0.01) ## 학습률 기본값은 1e-3