# 인공신경망 구성하기

## 실습 목표
----
- pytorch의 주요 기능을 이해한다.
- 주어진 데이터 셋을 활용하여 인공신경망을 설계한다. 
- 인공신경망 학습 과정을 코드로 작성하고, 학습이 완료된 모델을 생성한다

## 문제 정의
----

multiclass classifier

## 주요 코드


### 1. TensorDataset과 DataLoader

- 입력 데이터를 쉽게 처리하고, 배치 단위로 잘러서 학습할 수 있게 도와주는 모듈
- **Dataset** : 학습시 사용하는 feature와 target의 pair로 이루어짐. 
    - 아래에서 코드에서는 TensorDataset을 사용하여 Dataset 인스턴스를 생성했지만, 이미지의 사례와 같이 Dataset 클래스를 상속받아서 커스텀 인스턴스를 생성하는 형태로 많이 사용

- **DataLoader**: 학습 시 각 인스턴스에 쉽게 접근할 수 있도록 순회 가능한 객체(iterable)를 생성

![data loader](https://sebastianraschka.com/images/blog/2022/datapipes/loader-flow.png)


- **Sample code**
```
from torch.utils.data import  TensorDataset, DataLoader
```
```
# X,y로 분할한 데이터를 tensor로 변환
X_train = torch.tensor(X_train, dtype=torch.float32)
X_test = torch.tensor(X_test, dtype=torch.float32)
y_train = torch.tensor(y_train, dtype=torch.int64)
y_test = torch.tensor(y_test, dtype=torch.int64)
```
```
# tensor를 TensorDataset으로 생성 - X와 y가 짝으로 이루어짐
train_dataset = TensorDataset(X_train, y_train)
test_dataset = TensorDataset(X_test, y_test)
```
```
# DataLoader 형태로 생성
train_dataloader = DataLoader(train_dataset, batch_size=10, shuffle=True)
test_dataloader = DataLoader(test_dataset, batch_size=10, shuffle=True)
```

- **DataLoader가 하는 역할**
    - shuffling
    - batch ...
    
![data loader](https://sebastianraschka.com/images/blog/2022/datapipes/dataflow-good.png)



### 2. Device 설정
- 일반적으로 인공신경망의 학습은 (가능하다면) GPU를 사용하는 것이 바람직함
    - Colab Runtime 설정 변경
- GPU를 사용하여 학습을 진행하도록 명시적으로 작성 필요
- 연산 유형에 따라 GPU에서 수행이 불가능한 경우도 존재하는데, 그럴 경우도 마찬가지로 명시적으로 어떤 프로세서에서 연산을 수행해야하는지 코드로 작성해야함 

```
device = 'cuda' if torch.cuda.is_available() else 'cpu'
model = NeuralNetwork().to(device)
```


### 3. 신경망 생성

- **torch.nn 패키지**는 신경망 생성 및 학습 시 설정해야하는 다양한 기능을 제공

```
import torch.nn as nn
```
- 신경망을 **nn.Module**을 상속받아 정의
    - __ __init__ __(): 신경망에서 사용할 layer를 초기화하는 부분
    - __forward()__: feed foward 연산 수행 시, 각 layer의 입출력이 어떻게 연결되는지를 지정

```
class NeuralNetwork(nn.Module):
    def __init__(self):
        super(NeuralNetwork, self).__init__()
        self.input_layer    = nn.Linear(4, 16)
        self.hidden_layer1  = nn.Linear(16, 32)
        self.output_layer   = nn.Linear(32, 3)
        self.relu = nn.ReLU()
    
    def forward(self, x):
        out =  self.relu(self.input_layer(x))
        out =  self.relu(self.hidden_layer1(out))
        out =  self.output_layer(out)
        return out

```


### 4. Model compile

- 학습 시 필요한 정보들(loss function, optimizer)을 선언
- 일반적으로 loss와 optimizer는 아래와 같이 변수로 선언하고, 변수를 train/test 시 참고할 수 있도록 매개변수로 지정해줌 

```
learning_rate = 0.01
loss = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(),lr=learning_rate)
```


### 5. Train
- **신경망의 학습과정**을 별도의 함수로 구성하는 것이 일반적
    - feed forward -> loss -> error back propagation -> (log) -> (반복)

```
def train_loop(train_loader, model, loss_fn, optimizer):
    for batch, (X, y) in enumerate(train_loader):
        X, y = X.to(device), y.to(device)
        pred = model(X)
        loss = loss_fn(pred, y)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
```

### 6. Test

- 학습과정과 비슷하나 error back propagate하는 부분이 없음
    - feed forward -> loss ->  (log) -> (반복)

```
def test_loop(test_loader, model, loss_fn):
    size = len(test_loader.dataset)
    num_batches = len(test_loader)
    test_loss, correct = 0, 0

    with torch.no_grad():
        for X, y in test_loader:
            X, y = X.to(device), y.to(device)
            pred = model(X)
            test_loss += loss_fn(pred, y).item()
            correct += (pred.argmax(1) == y).type(torch.float).sum().item()

    test_loss /= num_batches
    correct /= size
    print(f"Test Error: \n Accuracy: {(100*correct):>0.1f}%, Avg loss: {test_loss:8f}\n")


### 7. Iteration
- 신경망 학습은 여러 epochs을 반복해서 수행하면서 모델을 구성하는 최적의 파라미터를 찾음
- 지정한 epochs 수만큼 **학습**과정과 **평가**과정을 반복하면서, 모델의 성능(loss, accuracy 등)을 체크함

```
epochs = 10
for i in range(epochs) :
    print(f"Epoch {i+1} \n------------------------")
    train_loop(train_dataloader, model, loss, optimizer)
    test_loop(test_dataloader, model, loss)
print("Done!")
```

## Basic Neural Network

iris 데이터셋을 사용하여 꽃의 품종을 구분하는 분류기를 신경망을 사용하여 구현해봅니다.

#### [Step1] Load libraries & Datasets

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
import torch
import torch.nn as nn
from torch.utils.data import TensorDataset, DataLoader

# 데이터 불러오기
iris=load_iris()
df=pd.DataFrame(data=iris.data, columns=iris.feature_names)
df['label']=iris.target

# 데이터 분할
y=df['label']
X=df.drop(['label'],axis=1)
X_train, X_test, y_train, y_test = train_test_split(X.values, y.values, random_state=42, stratify=y)
# 각각의 품종이 동일한 비율로 들어갈 수 있게 stratify=y로 입력해주었으며 train과 test에 대한 split비율을 정하지
# 않았으면 default값으로 분리되어 들어가게 된다.

#### [Step2] Create DataLoader

In [None]:
X_train=torch.tensor(X_train, dtype=torch.float32)
X_test=torch.tensor(X_test, dtype=torch.float32)
y_train=torch.tensor(y_train, dtype=torch.int64)
y_test=torch.tensor(y_test, dtype=torch.int64)

train_dataset= TensorDataset(X_train, y_train)
test_dataset= TensorDataset(X_test, y_test)

train_dataloader = DataLoader(train_dataset, batch_size=10, shuffle=True)
test_dataloader= DataLoader(test_dataset, batch_size=10, shuffle=True)
# dataloader에 batchsizenum, ( X_data 10개 ,y_data 10개 )로 되어있다.
i=2
for batch, (X,y) in enumerate(train_dataloader):
    print(batch,(X,y))
    if i>2:
      break
    else:
      i+=1

0 (tensor([[5.5000, 2.4000, 3.8000, 1.1000],
        [5.9000, 3.2000, 4.8000, 1.8000],
        [4.8000, 3.0000, 1.4000, 0.1000],
        [7.0000, 3.2000, 4.7000, 1.4000],
        [5.2000, 4.1000, 1.5000, 0.1000],
        [5.7000, 2.6000, 3.5000, 1.0000],
        [5.2000, 2.7000, 3.9000, 1.4000],
        [6.3000, 3.3000, 6.0000, 2.5000],
        [4.7000, 3.2000, 1.3000, 0.2000],
        [6.2000, 2.2000, 4.5000, 1.5000]]), tensor([1, 1, 0, 1, 0, 1, 1, 2, 0, 1]))
1 (tensor([[6.7000, 3.1000, 4.7000, 1.5000],
        [6.3000, 2.5000, 5.0000, 1.9000],
        [5.0000, 3.0000, 1.6000, 0.2000],
        [4.6000, 3.1000, 1.5000, 0.2000],
        [4.6000, 3.4000, 1.4000, 0.3000],
        [6.1000, 3.0000, 4.6000, 1.4000],
        [7.2000, 3.2000, 6.0000, 1.8000],
        [6.4000, 2.9000, 4.3000, 1.3000],
        [6.3000, 2.7000, 4.9000, 1.8000],
        [5.4000, 3.9000, 1.7000, 0.4000]]), tensor([1, 2, 0, 0, 0, 1, 2, 1, 2, 0]))


  X_train=torch.tensor(X_train, dtype=torch.float32)
  X_test=torch.tensor(X_test, dtype=torch.float32)
  y_train=torch.tensor(y_train, dtype=torch.int64)
  y_test=torch.tensor(y_test, dtype=torch.int64)


#### [Step3] Set Network Structure

In [None]:
class NNnet(nn.Module):
  def __init__(self):
    super(NNnet,self).__init__()
    self.input_layer=nn.Linear(4,16)
    self.hidden_layer1=nn.Linear(16,32)
    self.output_layer=nn.Linear(32,3)
    self.relu=nn.ReLU()

  def forward(self,x):
    out=self.relu(self.input_layer(x))
    out=self.relu(self.hidden_layer1(out))
    out=self.output_layer(out)
    return out

#### [Step4] Create Model instance

In [None]:
device='cuda' if torch.cuda.is_available() else 'cpu'
print(f'device={device}')

model=NNnet().to(device)

device=cpu


#### [Step5] Model compile

In [None]:
# 모델 컴파일
# 다중 분류 문제이기 때문에 crossentropyloss를 이용한다
learning_rate=0.001
loss=nn.CrossEntropyLoss()
optimizer=torch.optim.Adam(model.parameters(),lr=learning_rate)

#### [Step6] Set train loop

In [None]:
def train_loop(train_loader, model, loss_fn, optimizer):
  size= len(train_loader.dataset)
  
  for batch, (X,y) in enumerate(train_loader):
    X,y=X.to(device), y.to(device)
    pred=model(X)

    # 손실 계산
    loss=loss_fn(pred,y)

    # 역전파
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    loss, current = loss.item(), batch * len(X)
    print(f'loss:{loss:>7f} [{current:>5d}]/{size:5d}')

#### [Step7] Set test loop

In [None]:
def test_loop(test_loader, model, loss_fn):
  size=len(test_loader.dataset)
  num_batches=len(test_loader)
  test_loss, correct=0,0

  with torch.no_grad():
    for X,y in test_loader:
      X,y = X.to(device), y.to(device)
      pred=model(X)
      test_loss += loss_fn(pred, y).item()
      correct += (pred.argmax(1)==y).type(torch.float).sum().item()

  test_loss /= num_batches
  correct /=size
  print(f'Test Error: \n Accuracy: {(100*correct):>0.1f}%, Avg loss: {test_loss:8f}\n')

#### [Step8] Run model

In [None]:
# 모델 실행
epochs=10

for i in range(epochs):
  print(f'Epoch{i+1}\n----------------------')
  train_loop(train_dataloader, model, loss, optimizer)
  test_loop(test_dataloader, model, loss)
print('Done')

Epoch1
----------------------
loss:1.107731 [    0]/  112
loss:1.100865 [   10]/  112
loss:1.096999 [   20]/  112
loss:1.092211 [   30]/  112
loss:1.086746 [   40]/  112
loss:1.078221 [   50]/  112
loss:1.111041 [   60]/  112
loss:1.089211 [   70]/  112
loss:1.087043 [   80]/  112
loss:1.101246 [   90]/  112
loss:1.075884 [  100]/  112
loss:1.073514 [   22]/  112
Test Error: 
 Accuracy: 65.8%, Avg loss: 1.073557

Epoch2
----------------------
loss:1.068579 [    0]/  112
loss:1.050016 [   10]/  112
loss:1.064685 [   20]/  112
loss:1.053509 [   30]/  112
loss:1.069495 [   40]/  112
loss:1.071288 [   50]/  112
loss:1.062282 [   60]/  112
loss:1.046498 [   70]/  112
loss:1.061348 [   80]/  112
loss:1.069272 [   90]/  112
loss:1.083152 [  100]/  112
loss:1.024228 [   22]/  112
Test Error: 
 Accuracy: 44.7%, Avg loss: 1.045456

Epoch3
----------------------
loss:1.077618 [    0]/  112
loss:1.032171 [   10]/  112
loss:1.021152 [   20]/  112
loss:1.045001 [   30]/  112
loss:1.015447 [   40]/  