In [1]:
import torch
import torch.onnx as onnx
import torchvision.models as models

## 모델 가중치 저장하고 불러오기
* PyTorch 모델은 학습한 매개변수를 ```state_dict```라고 불리는 내부 상태 사전(internal state dictionary)에 저장
* 이 상태 값들은 ```torch.save``` 메소드를 사용하여 저장(persist)할 수 있다.

In [2]:
model = models.vgg16(pretrained=True)
torch.save(model.state_dict(), 'model_weights.pth')

Downloading: "https://download.pytorch.org/models/vgg16-397923af.pth" to C:\Users\Seonyeong/.cache\torch\hub\checkpoints\vgg16-397923af.pth


HBox(children=(HTML(value=''), FloatProgress(value=0.0, max=553433881.0), HTML(value='')))




모델 가중치를 불러오기 위해서는, 먼저 동일한 모델의 인스턴스(instance)를 생성한 다음에 ```load_state_dict()``` 메소드를 사용해 매개변수들을 불러온다.

---
추론(inference)을 하기 전에 ```model.eval()``` 메소드를 호출하여 드롭아웃(dropout)과 배치 정규화(batch normalization)를 평가 모드(evaluation mode)로 설정해야 한다. 그렇지 않으면 일관성 없는 추론 결과가 생성된다.

In [3]:
model = models.vgg16() # 기본 가중치를 불러오지 않으므로 pretrained=True를 지정하지 않는다.
model.load_state_dict(torch.load('model_weights.pth'))
model.eval()

VGG(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace=True)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace=True)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace=True)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace=True)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace=True)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace=True)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace=True)
    (16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1

## 모델의 형태를 포함하여 저장하고 불러오기
모델의 가중치를 불러올 때, 신경망의 구조를 정의하기 위해 모델 클래스를 먼저 생성(instantiate)해야 했다. 이 클래스의 구조를 모델과 함께 저장하고 싶으면, (model.state_dict()가 아닌) model 을 저장 함수에 전달한다.

In [4]:
torch.save(model, 'model.pth')

In [5]:
# 모델 불러오기
model = torch.load('model.pth')

## 모델을 ONNX로 내보내기
* PyTorch는 기본(native) ONNX 내보내기를 지원
* 그러나 PyTorch 실행 그래프의 동적 특성(dynamic nature) 때문에, 내보내는 과정에 ONNX 모델을 생성하기 위해 실행 그래프를 탐색(traverse)해야 한다.
* 이러한 이유 때문에 내보내기 단계에서는 적절한 크기의 테스트 변수를 전달해야 한다.

In [6]:
input_image = torch.zeros((1,3,224,224))
onnx.export(model, input_image, 'model.onnx')