## Introduction à Pytorch 

https://ipython.readthedocs.io/en/stable/install/kernel_install.html#kernels-for-different-environments

# Pourquoi apprendre Pytorch ?

* Momentum dans la recherche
https://trends.google.com/trends/explore?date=all&geo=FR&q=pytorch,keras&hl=fr

* Pytorch est très performant

![Performance of frameworks](https://unfoldai.com/storage/2024/08/keras-pytorch-performance.jpg)





## Pourquoi PyTorch pourrait être préféré à Keras : Une comparaison

**PyTorch** et **Keras** sont deux bibliothèques Python populaires pour le deep learning, chacune avec ses forces et ses faiblesses. Choisir l'une ou l'autre dépend souvent des besoins spécifiques du projet. Voici quelques raisons pour lesquelles un développeur pourrait préférer PyTorch à Keras :

### 1. **Flexibilité et contrôle:**
* **Graphiques dynamiques:** PyTorch offre une grande flexibilité grâce à ses graphiques dynamiques, permettant de modifier le modèle à la volée. Cela est particulièrement utile pour la recherche et les modèles expérimentaux.
* **Bas niveau:** PyTorch est plus proche du matériel, ce qui donne un meilleur contrôle sur l'optimisation et le débogage.
* **Intégration avec d'autres outils:** PyTorch s'intègre facilement avec d'autres bibliothèques Python, ce qui le rend très polyvalent.

### 2. **Communauté et écosystème:**
* **Recherche active:** PyTorch est très populaire dans la communauté de recherche en apprentissage profond, ce qui signifie que de nouvelles fonctionnalités et améliorations sont souvent ajoutées.
* **Grand écosystème:** PyTorch dispose d'un écosystème riche et en constante évolution, avec de nombreux outils et bibliothèques complémentaires.

### 3. **Performances:**
* **Tensor opérations:** PyTorch offre des performances élevées grâce à son optimisation des opérations sur les tenseurs.
* **GPU accélération:** PyTorch est bien intégré avec les GPU, ce qui est essentiel pour les modèles de deep learning exigeants.

### 4. **Pythonic:**
* **Naturel:** PyTorch est conçu pour être très Pythonic, ce qui facilite l'apprentissage et l'utilisation pour les développeurs Python expérimentés.



# Un entrainement classique


## De quoi avons besoin pour entrainer un réseau de neurones ?

1. Des données labélisées
2. Un fonction de cout 
3. Un optimiseur
4. Des hyperparamètres


# Importation des librairies 

In [None]:
import torch
import torch.nn as nn



import numpy as np
import matplotlib.pyplot as plt

# Dataset
$$ y = sin(2\pi x)$$
$$ x \in [[0;1]]$$

In [None]:
# Créeons un dataset pour modéliser la fonction sinus

seed = 2024
np.random.seed(seed)
N = 1000
percentage_of_training_data = 0.3

# Generate randomly the data

x= np.random.rand(N)
y = 


x_train= 
y_train = 
x_val = 
y_val=

#Create the device 

device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")

In [None]:
# Affichage

plt.scatter(x_train,y_train)
plt.title("Train data")


In [None]:
# Affichage

plt.scatter(x_val,y_val)
plt.title("Val data")

# Modèle

In [None]:
# Fully connected neural network with one hidden layer
class NeuralNet(nn.Module):
    def __init__(self, input_size, hidden_size, out_dim):
        """
        Args
        input_size : Taille d'entrée
        hidden_size : dimension couches cachées
        out_dim : dimension de sortie

        """
        super(NeuralNet, self).__init__()
        
    
    def forward(self, x):
        
        
        return out

    
    # Fully connected neural network with one hidden layer
class SequentialNeuralNet(nn.Module):
    
    def __init__(self, input_size, hidden_size, out_dim):
        """
        Args
        input_size : Taille d'entrée
        hidden_size : dimension couches cachées
        out_dim : dimension de sortie

        """
        super(NeuralNet, self).__init__()
       
 
    
    def forward(self, x):
        
        return out
    


In [None]:
input_size = 1
hidden_size = 32
num_classes = 1
model = NeuralNet(input_size, hidden_size, num_classes).to(device)


In [None]:
#Model parameters

for name, param in model.named_parameters():
    print(name , param, param.requires_grad, "\n"+"----------------------------------"*2)

# Fonction de cout

In [None]:
# Loss and optimizer
criterion = nn.MSELoss()

# Optimiseur

In [None]:
learning_rate = 0.001
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)  

# Entrainement du modèle

In [None]:
# Train the model
batch_size = 10
num_epochs = 500
N_train = 
batch_per_epoch = 
batch_per_epoch = 

x_train = 
y_train = 

model.train()

for epoch in range(num_epochs):
    avg_loss = 0.0
    for i in range(batch_per_epoch):  

         # Move tensors to the configured device
        x_train_batch =
        y_train_batch =

        
        # Forward pass

        
        # Backward and optimize

        avg_loss +=loss
        
    avg_loss/=batch_per_epoch
        
        #if (i+1) % 100 == 0:
    print ('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}' 
           .format(epoch+1, num_epochs, i+1, batch_per_epoch, avg_loss.item()))

# Predict

In [None]:
x_val = 


model.eval()
with torch.no_grad():
    y_val_pred = model(x_val.to(device))
# Affichage
y_val_pred = y_val_pred.detach().cpu().numpy()
plt.scatter(x_val,y_val_pred,label = "prediction")
plt.scatter(x_val,y_val, label ="true")
plt.legend()
plt.title("Prediction vs Exact data")

# Save the model

In [None]:
path = "./mymodel.pt"

#Sauvegardez toujours votre modèle sur CPU !

# Save just the state dict


#Save the model as a pickle object



# Load the model

In [None]:
# Load just the state dict

#Load the pickle object

# Model class must be defined somewhere


Le processus de sauvegarde/chargement utilise la syntaxe la plus intuitive et implique le moins de code possible. Enregistrer un modèle de cette manière sauve le module entier en utilisant le module pickle de Python. L'inconvénient de cette approche est que les données sérialisées sont liées aux classes spécifiques et à la structure exacte du répertoire utilisée lors de l'enregistrement du modèle. Cela est dû au fait que pickle n'enregistre pas la classe du modèle elle-même. Au lieu de cela, il enregistre un chemin vers le fichier contenant la classe, qui est utilisé lors du chargement. Pour cette raison, votre code peut rencontrer des problèmes dans divers cas d'utilisation, comme dans d'autres projets ou après des refactorisations.   

Une convention courante dans PyTorch consiste à enregistrer les modèles avec l'extension .pt ou .pth.

N'oubliez pas d'appeler model.eval() pour définir les couches de dropout et de normalisation par lots en mode évaluation avant d'exécuter l'inférence. Ne pas le faire entraînera des résultats d'inférence incohérents.



# Créer un module custom

## Batch Normalisation



Ecrire le module de batch normalisation 1d .
$$y= \beta + \frac{x-E(x)}{\sqrt{Var(x)+\epsilon}} * \gamma$$


Calculer E(x) et Var(x) avec un momentum :

E(x) = momentum * E(x) + (1 - momentum) * batch_mean
Prendre $\epsilon$ = 1e-5 , momentum = 0.9.

Distinguer la phase d'apprentissage et de test. En phase d'inférence , les moyennes sont figées

In [None]:

class BatchNorm1d(nn.Module):


In [None]:
# Create a batch normalization layer
bn_layer = BatchNorm1d(num_features=10)

# Input tensor
x = torch.randn(4, 10)  # Batch size 32, 10 features

#torch batch normalisation

torch_bn_layer = nn.BatchNorm1d(num_features=10)
# Apply batch normalization
output = bn_layer(x)
output_torch = torch_bn_layer(x)

print(torch.allclose(output,output_torch))

## Resnet Block 

![ResNet Block](https://d2l.ai/_images/residual-block.svg)

In [None]:
class ResNetBlock(nn.Module):
    def __init__(self, in_channels, out_channels, stride=1):


# Exercice : Faire un modèle qui est une combinaison linéaire de 2 autres modèles

# Chargement de données efficaces
# Que se passe il si mon dataset est plus grand que ma RAM ?

## Dataloader and dataset


In [None]:
class SineDataset(torch.utils.data.Dataset):

    



    


In [None]:
dataset=SineDataset(N = 10**3,seed = 2024,percentage_of_training_data = 0.3,train_mode = True)

dataloader = torch.utils.data.DataLoader(dataset, 
                                           batch_size=batch_size, 
                                           shuffle=True,num_workers=1)

In [None]:
input_size = 1
hidden_size = 32
num_classes = 1
model = NeuralNet(input_size, hidden_size, num_classes).to(device)

In [None]:
# Train the model
batch_size = 10
num_epochs = 500

model =model.to(device)
model.train()
learning_rate = 0.001
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)  
for epoch in range(num_epochs):
    avg_loss = 0.0
    
    avg_loss/=i
        
        #if (i+1) % 100 == 0:
    print ('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}' 
           .format(epoch+1, num_epochs, i+1, batch_per_epoch, avg_loss.item()))

In [None]:
dataset.is_train = True
model.eval()
x_val, y_val_true , y_val_pred = [], [],[]

with torch.no_grad():





# Affichage

plt.scatter(x_val,y_val_pred,label = "prediction")
plt.scatter(x_val,y_val_true, label ="true")
plt.legend()
plt.title("Prediction vs Exact data")

In [None]:
import torchvision
# Device configuration
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

# Hyper-parameters 




# MNIST dataset 
train_dataset = torchvision.datasets.MNIST(root='../../data', 
                                           train=True, 
                                           transform=transforms.ToTensor(),  
                                           download=True)

test_dataset = torchvision.datasets.MNIST(root='../../data', 
                                          train=False, 
                                          transform=transforms.ToTensor())

# Data loader
mnist_train_loader = torch.utils.data.DataLoader(dataset=train_dataset, 
                                           batch_size=batch_size, 
                                           shuffle=True)

mnist_test_loader = torch.utils.data.DataLoader(dataset=test_dataset, 
                                          batch_size=batch_size, 
                                          shuffle=False)



# Afficher quelque images aléatoirement du contenu du dataset  MNIST

# Exercice :  Charger le dataset suivant dans pytorch et afficher des images de chaque classe: 
https://drive.google.com/file/d/1V_zyw7kZ1YnPYM4VzCtP9agY7PiFuH-P/view?usp=sharing