PyTorch 모델은 학습한 매개변수를 `state_dict` 이라고 불리는 internal state dictionary에 저장한다.  
이 state 값들은 torch.save 함수를 이용하여 저장 할 수 있다고 한다.   
모델의 가중치를 불러와서 저장하려면 저장하려는 모델의 인스턴스를 생성한 다음 `load_state_dict()` 함수를 사용하여 매개변수를 불러온다.   
참고로 state_dict은 dictionary 이며 이 형태에 맞게 데이터를 저장하거나 불러오는 것이 가능하다.   
이는 각 계층을 매개변수 Tensor로 매핑하며 학습 가능한 매개변수를 갖는 계층(conv layer, linear layer, ...) 등이 모델의 `state_dict`에 항목을 가지게 된다.  

**1. 모델의 형태를 포함하여 저장하는 방법**

In [2]:
import torch
from torchvision import models


model = models.resnet50() # or 저장하고자 하는 모델 

torch.save(model, 'model.pth')
torch.load('model.pth')

  torch.load('model.pth')


ResNet(
  (conv1): Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False)
  (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (relu): ReLU(inplace=True)
  (maxpool): MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
  (layer1): Sequential(
    (0): Bottleneck(
      (conv1): Conv2d(64, 64, kernel_size=(1, 1), stride=(1, 1), bias=False)
      (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv3): Conv2d(64, 256, kernel_size=(1, 1), stride=(1, 1), bias=False)
      (bn3): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (downsample): Sequential(
        (0): Conv2d(64, 256, kernel_size=(1, 1), stride=(1, 

**2. 학습된 모델의 매개변수(state_dict)만 저장하는 방법**

In [3]:
torch.save(model.state_dict(), 'model.pth')
model.load_state_dict(torch.load('model.pth'))

  model.load_state_dict(torch.load('model.pth'))


<All keys matched successfully>

In [6]:
from model import STgramMFN
if torch.cuda.is_available():
    device = torch.device('cuda')
else:
    device = torch.device('cpu')
model = STgramMFN(16).to(device)

state_dict = torch.load("../model/best_checkpoint_-6_dB.pth.tar")['model']

  state_dict = torch.load("../model/best_checkpoint_-6_dB.pth.tar")['model']


In [8]:
state_dict
model.load_state_dict(state_dict)

<All keys matched successfully>

In [9]:
model.eval()

STgramMFN(
  (tgramnet): TgramNet(
    (large_kernel): Conv1d(1, 128, kernel_size=(1024,), stride=(512,), padding=(512,), bias=False)
    (conv_blocks): Sequential(
      (0): LayerNorm((313,), eps=1e-05, elementwise_affine=True)
      (1): LeakyReLU(negative_slope=0.01)
      (2): Conv1d(128, 128, kernel_size=(3,), stride=(1,), padding=(1,), bias=False)
      (3): LayerNorm((313,), eps=1e-05, elementwise_affine=True)
      (4): LeakyReLU(negative_slope=0.01)
      (5): Conv1d(128, 128, kernel_size=(3,), stride=(1,), padding=(1,), bias=False)
      (6): LayerNorm((313,), eps=1e-05, elementwise_affine=True)
      (7): LeakyReLU(negative_slope=0.01)
      (8): Conv1d(128, 128, kernel_size=(3,), stride=(1,), padding=(1,), bias=False)
    )
  )
  (mobilefacenet): MobileFaceNet(
    (conv1): ConvBlock(
      (conv): Conv2d(2, 64, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
      (bn): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (p