# Loading a PyTorch model

În cadrul lecții precedente am învățat cum anume putem să salvăm un model de PyTorch dacă suntem mulțumiți cu performanța acestuia. Salvarea modelului ne scutește de crearea unui nou model și de antrenarea acestuia, aceasta păstrânduși hyperparametrii și valorile acestora în momentul în care a fost salvat. După cum s-a văzut, putem salva un model de PyTorch utilizând metoda **torch.save()** căreia îi oferim ca și valoare *state_dict()* modelului și un path către locația unde dorim să salvăm acel model. Pentru a funcția corect, modelul trebuie salvat cu extensia **.pth**

    - torch.save(model_0.state_dict(), './models/01_pytorch_workflow_model_01.pth')

Din moment ce am salvat modelul acela în cadrul memoriei calculatorului, acuma putem să facem load la acel model și să îl folosim pentru a face predicții cu el. Pentru a face load la un model o să ne folosim de metoda `torch.load()`. Această metodă deserializează tensorii pe CPU și abia apoi sunt mutați înapoi pe device-ul pe care au fost salvați. Este important de reținut asta deoarece dacă salvăm un model cu tensori de GPU, atunci când îi facem load la model, acesta o să conțină aceași tensori tot pe GPU (asta în cazul în care se dispune de GPU).

În lecția precedentă am salvat doar state_dict() ce îl are modelul (adică doar informațiile de pe model), nu modelul în sine. Asta înseamnă că prima dată trebuie să ne creem o instanță a unui model și abia după să facem load la acest state_dict() ca să fie suprascris peste modelul nou creat. În continuare  o să ne creem același model cu care am tot lucrat, o să ne creme o instanță a modelului după care o să rescriem acel state_dict(). Rescriere se va face cu metoda `torch.nn.Modul.load_state_dict()`. În cadrul acestei metode trebuie să apelăm metoda `torch.load()` căreia să îi oferim ca și argument path-ul către modelul salvat

In [1]:
# importing the libraries
import torch
from torch import nn

In [5]:
# creating a model
class LinearRegressionModel(nn.Module):

    # all models should inherite from nn.Module
    # all models should overwrite the __init__() method
    def __init__(self):
        super().__init__()

        self.weight = nn.Parameter(torch.randn(1, requires_grad=True, dtype=torch.float32))
        self.bias = nn.Parameter(torch.randn(1, requires_grad=True, dtype=torch.float32))

    # overwriting the forward() method
    # all models should overwrite this method
    def forward(self, x):
        # this is the method where the computation is made
        return self.weight * x + self.bias

In [6]:
# creating an instance of the model
# setting the random seed
torch.manual_seed(42)

# creating an instance of the model
model_0 = LinearRegressionModel()

In [7]:
# checking the state_dict() of the model
model_0.state_dict()

OrderedDict([('weight', tensor([0.3367])), ('bias', tensor([0.1288]))])

După ce am creat noul model observăm faptul că valorile parametrilor sunt cele care s-au creat inițial. Modelul cu care am lucrat în lecția precedentă, după antrenare avea valorile parametrilor mai apropiate de valorile adevărate (acele variabile de weight și bias pe care le-am creat pentru a ne forma setul de date). Putem să facem load la acei parametrii la acest model pentru a ajunge din nou la acele valori, astfel încât să nu mai fim nevoiți să reantrenăm modelul respectiv

In [8]:
model_0.load_state_dict(torch.load('./models/01_PyTorch_Workflow_model_01.pth'))

<All keys matched successfully>

Rezultatul comenzii de mai sus este "All keys matched successfully", ceea ce înseamnă că valorile parametrilor au fost suprascrise. Ca să verificăm asta putem să printăm din nou state_dict() ce îl are modelul acuma după ce s-a făcut load la aceste date

In [9]:
model_0.state_dict()

OrderedDict([('weight', tensor([0.6990])), ('bias', tensor([0.3093]))])

După cum se poate observa, valorile acestor parametrii sunt acuma mult mai apropiate de valorile reale, sunt defapt valorile parametrilor ale modelului antrenat din lecția precedentă. Am reușit să ajungem la aceleași valori fără a mai reantrena modelul.

## Recapitulare

În secțiunea curentă an învățat cum putem să facem load la state_dict() pe care l-am salvat anterior la o nouă instanță a modelului.

```python
import torch

model_0 = LinearRegressionModel()

model_0.load_state_dict(torch.load(PATH_TO_SAVED_STATE_DICT))
```