# 모델 저장하고 불러오기

In [1]:
import torch
import torch.onnx as onnx
import torchvision.models as models

C:\Users\bini\anaconda3\envs\anaconda\lib\site-packages\numpy\.libs\libopenblas.TXA6YQSD3GCQQC22GEQ54J2UDCXDXHWN.gfortran-win_amd64.dll
C:\Users\bini\anaconda3\envs\anaconda\lib\site-packages\numpy\.libs\libopenblas.WCDJNK7YVMPZQ2ME2ZZHJJRJ3JIKNDB7.gfortran-win_amd64.dll
  stacklevel=1)


## 모델 가중치 저장하고 불러오기

PyTorch 모델은 학습한 매개변수를 **`state_dict`**라고 불리는 `내부 상태 사전(internal state dictionary)`에 저장합니다. 이 상태 값들은 **`torch.save 메소드**를 사용하여 저장`(persist)할 수 있습니다:

In [2]:
model = models.vgg16(pretrained=True)
torch.save(model.state_dict(), 'model_weights.pth')

Downloading: "https://download.pytorch.org/models/vgg16-397923af.pth" to C:\Users\bini/.cache\torch\hub\checkpoints\vgg16-397923af.pth


HBox(children=(FloatProgress(value=0.0, max=553433881.0), HTML(value='')))




In [6]:
len(model.state_dict())

32

In [11]:
state_dict = model.state_dict()
#state_dict['features.0.weight']

모델 가중치를 불러오기 위해서는, 먼저 `동일한 모델의 인스턴스(instance)를 생성`한 다음에 **`load_state_dict() 메소드를 사용`**하여 매개변수들을 불러옵니다.

In [12]:
model = models.vgg16() # 기본 가중치를 불러오지 않으므로 pretrained=True를 지정하지 않습니다.
model.load_state_dict(torch.load('model_weights.pth'))
model.eval()

VGG(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace=True)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace=True)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace=True)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace=True)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace=True)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace=True)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace=True)
    (16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1

무슨 의미인지 궁금해서 이번에 찾아보니, nn.Module에서 train time과 eval time에서 수행하는 다른 작업을 수행할 수 있도록 **switching 하는 함수**라고 한다.

train time과 eval time에서 다르게 동작해야 하는 대표적인 예들은

* Dropout Layer
* BatchNorm Layer
등등이 있다고 한다.

.eval() 함수는 `evaluation 과정에서 사용하지 않아야 하는 layer들을 알아서 off` 시키도록 하는 함수인 셈이다.

`evaluation/validation 과정에선` 보통 `model.eval()`과 `torch.no_grad()`를 함께 사용한다고 한다. 그렇지 않으면 일관성 없는 추론 결과가 생성됩니다

## 모델의 형태를 포함하여 저장하고 불러오기

모델의 가중치를 불러올 때, 신경망의 구조를 정의하기 위해 모델 클래스를 먼저 생성(instantiate)해야 했습니다. 이 `클래스의 구조를 모델과 함께 저장`하고 싶으면, `(model.state_dict()가 아닌) model 을 저장 함수에 전달`합니다:

In [13]:
torch.save(model, 'model.pth')

다음과 같이 모델을 불러올 수 있습니다:

In [14]:
model = torch.load('model.pth')

**이 접근 방식은 Python pickle 모듈을 사용하여 모델을 직렬화(serialize)하므로, 모델을 불러올 때 실제 클래스 정의(definition)를 적용(rely on)합니다.**