# 파이토치 API를 활용한 딥러닝 모델 구현

In [3]:
import torch
from tensorflow.keras.datasets import mnist
import numpy as np
import matplotlib.pyplot as plt

## 훈련데이터 준비

In [4]:
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
[1m11490434/11490434[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 0us/step


## 데이터 전처리

In [6]:
train_images = train_images.reshape((60000, 28 * 28))
test_images = test_images.reshape((10000, 28 * 28))

## pipeline 생성
<p>학습 데이터를 torch.Tensor로 변환</p>
<p>변환 된 torch.Tensor 객체를 Dataset 객체에 연결</p>
<p>Batch 구성을 위한 DataLoader 객체 생성</p>

In [8]:
train_x = torch.Tensor(train_images)
train_y = torch.LongTensor(train_labels)

test_x = torch.Tensor(test_images)
test_y = torch.LongTensor(test_labels)

In [15]:
train_dataset = torch.utils.data.TensorDataset(train_x, train_y)
test_dataset = torch.utils.data.TensorDataset(test_x, test_y)

In [16]:
train_loader=torch.utils.data.DataLoader(train_dataset, batch_size=64, shuffle=True)
test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=64, shuffle=False)

## DNN 모델 정의

In [26]:
model = torch.nn.Sequential()

In [27]:
model.append(module=torch.nn.Linear(784, 256, bias=True))
model.append(module=torch.nn.ReLU())
model.append(module=torch.nn.Linear(256, 10, bias=True))

Sequential(
  (0): Linear(in_features=784, out_features=256, bias=True)
  (1): ReLU()
  (2): Linear(in_features=256, out_features=10, bias=True)
)

In [28]:
from torchsummary import summary

## 학습 관련 객체 생성

In [31]:
loss = torch.nn.CrossEntropyLoss()

In [33]:
optim = torch.optim.RMSprop(params=model.parameters(), lr=0.001)

## 학습 및 검증

In [None]:
def train(epoch):
    #모델 객체를 학습에 적합한 상태로 변경
    model.train()

    # loss, acc 변수지정
    loss = 0
    acc = 0

    for batch_idx,(data, target) in enumerate(train_loader):
        # 모델의 순전파 수행
        output = model(data)

        # loss 함수에 모델의 예측값 과 정답 정보를 전달하여 loss 값 계산
        batch_loss = loss(output, target)

        #optim 초기화
        optim.zero_grad()

        # model을 구성하는 param(w, b)이 loss에 미치는 영향도 계산
        batch_loss.backward()

        # 계산된 영향도(gradient)값을 이용하여 param(w,b) 업데이트
        optim.step()