In [1]:
import torch
import torchvision.models as models

#### Saving and Loading Model Weights
- PyTorch 모델은 학습된 파라미터를 state_dict라는 내부 상태 사전에 저장합니다. 이러한 상태는 torch.save 방법을 통해 지속할 수 있습니다.

In [2]:
model = models.vgg16(pretrained=True)
model

Downloading: "https://download.pytorch.org/models/vgg16-397923af.pth" to /home/jupyter-hadoop/.cache/torch/hub/checkpoints/vgg16-397923af.pth


  0%|          | 0.00/528M [00:00<?, ?B/s]

VGG(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace=True)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace=True)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace=True)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace=True)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace=True)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace=True)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace=True)
    (16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1

In [3]:
torch.save(model.state_dict(), 'model_weights.pth')

- 모델 가중치를 로드하려면 먼저 동일한 모델의 인스턴스를 작성한 다음 load_state_dict() 방법을 사용하여 매개변수를 로드해야 합니다.
- 회의하기 전에 model.eval() 메소드를 호출하여 드롭아웃 및 배치 정규화 레이어를 평가 모드로 설정하십시오. 이렇게 하지 않으면 일관성 없는 추론 결과가 나올 것이다.

In [5]:
model = models.vgg16() # 사전 교육을 받지 않음=참입니다. 즉, 기본 가중치를 적재하지 않습니다
model.load_state_dict(torch.load('model_weights.pth'))
model.eval()

VGG(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace=True)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace=True)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace=True)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace=True)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace=True)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace=True)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace=True)
    (16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1

#### Saving and Loading Models with Shapes

- 모델 가중치를 로드할 때 클래스가 네트워크의 구조를 정의하기 때문에 먼저 모델 클래스를 인스턴스화해야 했습니다. 이 클래스의 구조를 모델과 함께 저장하고 싶을 수 있습니다.이 경우 model.state_dict()이 아닌 model을 저장 함수에 전달할 수 있습니다.

In [6]:
torch.save(model, 'model.pth')

In [7]:
model = torch.load('model.pth')

- 이 접근 방식은 모델을 직렬화할 때 Python 피클 모듈을 사용하므로 모델을 로드할 때 사용할 수 있는 실제 클래스 정의에 의존한다.