# Save, Load and run model predictions 
모델 상태를 지속하기 위해 저장, 읽은 후 예측 모델을 동작하는 방법을 다룸

In [54]:
import torch
import torch.onnx as onnx
import torchvision.models as models 

## Saving and loading model weights
pytorch 모델은 학습한 파라미터를 `state_dict`이라고 하는 내부 dictionary에 보관함. `torch.save` 함수를 사용하여 이를 저장할 수 있음

In [55]:
model = models.vgg16(pretrained=True)
torch.save(model.state_dict(), "data/model_weights.pth")

모델의 가중치를 다시 읽기 위해, 구조가 같은 모델 인스턴스를 만들고 load_state_dict() method로 파라미터를 읽어서 적용할 수 있음.

In [56]:
model = models.vgg16()
model.load_state_dict(torch.load("data/model_weights.pth"))
model.eval()

VGG(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace=True)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace=True)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace=True)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace=True)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace=True)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace=True)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace=True)
    (16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1

> **Note:** dropout이나 batch norm이 평가모드로 설정되도록 `model.eval()` 함수를 평가 전 호출했는지 확인해야 함. 호출하지 않았다면 일관적이지 않은 결과를 도출할 수 있음.

## Saving and loading models with shapes
모델의 가중치를 읽을 때에는 모델 클래스에 신경망의 구조가 정의되어 있으므로 모델 클래스의 인스턴스를 먼저 만드는 것이 필요함. 때문에 신경망의 파라미터와 더불어 신경망의 구조를 함께 저장하기 원한다면 `model.state_dict()` 대신 `model` 자체를 저장하거나 읽을 수 있음.

In [57]:
torch.save(model, 'data/vgg_model.pth')

In [58]:
model = torch.load('data/vgg_model.pth')

## Exporting the model to ONNX
- 다른 플랫폼, 다른 언어에서도 테스트가 가능하도록 기능 지원(ONNX runtime 필요)
- input_image는 맞은 자료형과 모양이라면 랜덤하게 결정되어도 무방함. sample data 개념.

[참고자료]
- [Pytorch를 모델을 ONNX으로 변환하고 ONNX 런타임에서 실행하기](https://tutorials.pytorch.kr/advanced/super_resolution_with_onnxruntime.html)
- [Pytorch를 ONNX에서 export 하기](https://yunmorning.tistory.com/17)
- https://netron.app/

In [59]:
input_image = torch.zeros((1,3,224,224))
onnx.export(model, input_image, 'data/model.onnx')