# 모델 전체 저장 및 불러오기

- 저장하기
  - `torch.save(model, 저장 경로)`
- 불러오기
  - `load_model = torch.load(저장 경로)`

# 모델의 파라미터만 저장

-   모델을 구성하는 파라미터만 저장한다.
-   모델의 구조는 저장하지 않기 때문에 불러올 때 **모델을 먼저 생성하고 생성한 모델에 불러온 파라미터를 덮어씌운다.**
-   모델의 파라미터는 **state_dict** 형식으로 저장한다.

### state_dict

-   모델의 파라미터 Tensor들을 레이어 단위별로 나누어 저장한 Ordered Dictionary (OrderedDict)
-   `모델객체.state_dict()` 메소드를 이용해 조회한다.
-   모델의 state_dict을 조회 후 저장한다.
    -   `torch.save(model.state_dict(), "저장경로")`
-   생성된 모델에 읽어온 state_dict를 덮어씌운다.
    -   `new_model.load_state_dict(torch.load("state_dict저장경로"))`


## Checkpoint 저장 및 불러오기

- 학습이 끝나지 않은 모델을 저장하고, 나중에 이어서 학습시키려면 모델의 구조와 파라미터뿐만 아니라 optimizer, loss 함수 등 학습에 필요한 객체들도 함께 저장해야 한다.
- 딕셔너리(Dictionary)에 저장하려는 값들을 key-value 쌍으로 구성하여 `torch.save()`를 이용해 저장한다.

```python
# 저장
torch.save({
    'epoch': epoch,
    'model_state_dict': model.state_dict(),
    'optimizer_state_dict': optimizer.state_dict(),
    'loss': train_loss
}, "저장경로")

# 불러오기
model = MyModel()
optimizer = optim.Adam(model.parameters())

# 불러온 checkpoint를 이용해 이전 학습 상태 복원
checkpoint = torch.load("저장경로")
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
epoch = checkpoint['epoch']
loss = checkpoint['loss']
```

>`nn.Module`은 PyTorch에서 딥러닝 모델을 만들기 위한 모든 클래스의 부모이며,<br>
>모델의 구조, 파라미터, 학습 관련 기능을 모두 포함하고 관리하는 기반 클래스.

필요하면 `nn.Module` 없이도 만들 수는 있지만, 학습과 저장/불러오기 기능을 쓰려면 반드시 상속받아야 한다.

# PROBLEMS

## 1. 간단한 모델 정의 후, 내가 정의한 모델의 정보를 파악해보기

In [None]:
# 1. 간단한 모델 정의 
import torch
import torch.nn as nn

class MyModel():  # 상속. 부모 클래스: nn.Module

    def __init__(self):
        super.__init__()                         # 부모 생성자 호출 
        self.lr1 = nn.Linear(3, 4)  # 입력: (batch_size, 3) → 출력: (batch_size, 4)
        self.lr2 = nn.Linear(4, 2)  # 입력: (batch_size, 4) → 출력: (batch_size, 2) 
        self.relu = nn.ReLU() 
    def forward(self, X): # lr1, lr2, relu를 적절한 순서로 배치
        X = self.lr1(X)
        X = self.relu()(X)
        X = 
        return X

In [None]:
# 2. 모델 생성 - 위 모델 클래스를 model1이라는 변수에 담아 호출하기
model1 =
model1

In [None]:
# 2. lr1 레이어의 레이어객체를 조회
## "lr1"이라는 변수에 할당하기
lr1 = 
lr1

In [None]:
# 3. lr1 레이어에서 weight 파라미터 조회
w =
print(w.shape)
w

In [None]:
# 4. lr1레이어에서 bias 파라미터 조회
b = 
print(b.shape)
b

In [None]:
# 5. lr2의 w,b를 조회해보자
## 1) lr2 정의
## 2) 각각 메서드 붙여 print함수에 담기
lr2 = 
print("weight:", )
print("bias:", )

## 2. 생성한 모델 저장 및 불러오기

In [None]:
import os
# 1. 저장할 디렉토리 설정
## 1) "saved_models"라는 폴더이름으로 생성.
## 2) but 폴더가 이미 있으면 그냥 지나가도록 키워드 파라미터 지정
## 3) saved_models라는 폴더 이미 있습니다! 일부러 이미 만들어둔거에요! 

os.makedirs("",)  


In [None]:
# 2. 모델을 저장
## 1) 위에서 간단히 만든 모델을
## 2) "saved_models"라는 디렉토리에 
## 3) "model1"이라는 이름으로 저장하기
## 4) 저장시 확장자는 ".pt"

torch.save(,)

In [None]:
# 3. 저장된 모델을 Load하기
## 1) "load_model"이라는 변수에 담기
## 2) 불러올 모델 경로 적기
## 3) 모델 전체를 불러오기위한 키워드파라미터 지정

= torch.load(,)

In [None]:
# 불러온 모델의 구조보기
# 그냥 호출해보시고, 어떤 식으로 정보를 보여주나 확인해보시면 됩니다.
# 별도로 기재하실 코드는 없습니다.
load_model

## 3. 저장한 모델과 불러온 모델이 같은 정보 갖는지 확인하기

In [None]:
# 1. load_model의 lr1와 lr2의 파라미터(weight, bias) 모두 출력해서 저장전 model의 파라미터가 그대로 저장됐는지 확인
## 저장전에는 lr1, lr2라는 변수에 레이어의 정보를 정의했고,
## 저장후 불러온 모델은 load_lr1, load_lr2라는 변수에 정의하고 양자를 비교하기
## 1) lr1에 관한 정보를 "load_lr1"라는 변수에 정의하기
## 2) lr2에 관한 정보를 "load_lr2"라는 변수에 정의하기
## 3) lr1, load_lr1, lr2, load_lr2에 각각 weight, bias메서드 붙여서 print()함수에 담아 출력하기

load_lr1 =
load_lr2 =
print() # lr1 weight
print() # load_lr1 weight
print() # lr1 bias
print() # load_lr1 bias

print("\n","="*50,"\n")

print() # lr2 weight
print() # load_lr2 weight
print() # lr2 bias
print() # load_lr2 bias

## 4. 모델의 파라미터들(W,b)만 저장/불러오기

In [None]:
# 1. 저장하기
## 1) 제일 처음에 만들었던 간단한 모델(model1)을 이용하기
## 2) "state_dict()" 메서드 이용하여 "state_dict"라는 변수에 담고, 호출해보기
state_dict =
state_dict

In [None]:
# 2. state_dict()의 저장형태는 dictionary
## key값들 호출하여 저장시 weight와 bias가 keys로서 저장된걸 확인
## 별도 기재할 코드 없이, 그냥 호출해보시면 됩니다.
state_dict.keys()

In [None]:
# 3. state_dict 저장
## 1) "state_dict"을
## 2) "saved_models"라는 디렉토리에
## 3) "model1_parameter"라는 이름으로 저장하기
## 4) 저장시 확장자는 ".pt"
torch.save()

In [None]:
# 4. state_dict load
## 1) "sd"이라는 변수에 담기
## 2) 불러올 모델 경로 적기
## 3) 마지막 줄에 "sd" 적어 sd 호출하기
= torch.load()

## 5. 새로운 모델 만들어서 불러온 파라미터를 덮어씌워보기

In [None]:
# 1. 새로운 모델 생성 후 파라미터 확인
## 1) "model2"라는 객체를 생성(변수에 할당)
## 2) "state_dict()"메서드 이용하여 현재 파라미터 호출하여 확인

model2 = 
model2.

In [None]:
# 2. "sd"에 담긴 파라미터 정보 덮어씌우기
## "load_state_dict()" 메서드 사용
model2.

In [None]:
# 3. 덮어씌워진 결과 확인
## "state_dict()" 메서드 사용
model2.

## 6. 모델의 구조 파악하기

In [None]:
from torchinfo import summary

# 1. 모델 구조 summary() 모듈 이용해서 확인하기
## 1) model1과 model2 모두 넣어서 모델의 구조 출력하기
## 2) 두 모델의 summary() 결과가 같은지 확인해보기
## 3) 동일한지 여부 결과는 false가 나와야합니다.
## 4) 두 모델의 구조가 같은데, 왜 false인지 생각해보기
## 5) (제가 처음에 True가 나올거라고 생각하고 출력해봤는데 False길래 궁금했던 부분이라 넣어봤어요!)

print() # model1

print("\n", "<"*25+"구분선"+">"*25, "\n")

print() # model2

print("\n", "<"*25+"구분선"+">"*25, "\n")

print( == )

In [None]:
# 2. imput data의 shape를 지정하여 넣어주어 각 layer의 output shape 확인
## 1) 확인할 대상인 모델은 model1이든 model2든 상관없습니다. 아무거나!
## 2) input data의 batch size는 100
## 3) 처음에 model의 class 만들때 코드를 어떻게 짰는지 생각하여 input data의 size를 생각해보기
summary(,(,))