<a href="https://colab.research.google.com/github/ElMartinez31/Data_Science/blob/main/Move_Pytorch_To_Production.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Mettre en production un mod√®le entra√Æn√©

Transformer un prototype (Jupyter Notebook, script de recherche) en une application scalable utilisable par des utilisateurs ou des syst√®mes.

Exemple : Un mod√®le RL entra√Æn√© pour jouer √† Mario pourrait √™tre d√©ploy√© dans un jeu autonome ou un robot.

Optimiser les performances

R√©duire la latence et la consommation m√©moire (via TorchScript, ONNX, ou la quantification).

Exemple : Un mod√®le PyTorch converti en TorchScript pour fonctionner sur mobile.

Compatibilit√© avec diff√©rents environnements

Faire fonctionner le mod√®le sur des serveurs, edge devices (t√©l√©phones, Raspberry Pi), ou le cloud (AWS, GCP).

Int√©gration avec des pipelines industrielles

Connecter le mod√®le √† des APIs (FastAPI, Flask), des bases de donn√©es, ou des outils comme Docker/Kubernetes.



üöÄONNX:

Interop√©rabilit√© : Exporter un mod√®le PyTorch vers ONNX permet de l'utiliser avec :

TensorFlow, MXNet, Scikit-learn (via onnxruntime)

Acc√©l√©rateurs mat√©riels (NVIDIA TensorRT, Intel OpenVINO)

Mobiles (Android/iOS via ONNX Runtime)

Optimisation : ONNX permet des optimisations (fusion d'op√©rations, quantification) pour des inf√©rences plus rapides.

Portabilit√© : Le fichier .onnx est autonome et contient tout le graphe de calcul.

Exemple : Exporter un mod√®le PyTorch en ONNX

In [None]:
import torch
import torch.nn as nn

# D√©finition d'un mod√®le simple
class SimpleModel(nn.Module):
    def __init__(self):
        super(SimpleModel, self).__init__()
        self.fc = nn.Linear(10, 2)  # Couche lin√©aire (10 entr√©es, 2 sorties)

    def forward(self, x):
        return self.fc(x)

model = SimpleModel()
model.eval()  # Mode √©valuation (important pour l'export ONNX)

In [None]:
# Export en ONNX

# Exemple d'input (batch_size=1, input_dim=10)
dummy_input = torch.randn(1, 10)

# Export ONNX
torch.onnx.export(
    model,                     # Mod√®le PyTorch
    dummy_input,               # Input exemple
    "simple_model.onnx",       # Nom du fichier de sortie
    input_names=["input"],     # Nom de l'input
    output_names=["output"],   # Nom de l'output
    dynamic_axes={
        "input": {0: "batch_size"},  # Axe dynamique (taille de batch variable)
        "output": {0: "batch_size"},
    },
)


#torch.onnx.export: convertit le mod√®le en fichier .onnx.
#dummy_input: est un exemple de tensor pour tracer le mod√®le.
#dynamic_axes: permet de sp√©cifier des dimensions variables (utile pour des batchs de tailles diff√©rentes).

Charger et utiliser un mod√®le ONNX

In [None]:
import onnxruntime as ort

# Cr√©ation d'un session ONNX Runtime
ort_session = ort.InferenceSession("simple_model.onnx")

# Input (doit correspondre au format attendu)
input_data = dummy_input.numpy()

# Inf√©rence
outputs = ort_session.run(
    None,  # None car on veut toutes les sorties
    {"input": input_data},
)

print(outputs)

V√©rifier l'export ONNX

In [None]:
import onnx

model_onnx = onnx.load("simple_model.onnx")
onnx.checker.check_model(model_onnx)  # V√©rifie que le mod√®le est valide
print(onnx.helper.printable_graph(model_onnx.graph))  # Affiche l'architecture

Cas pratique : Exporter un CNN (ex: ResNet)

In [None]:
import torchvision

# Charger ResNet-18 pr√©-entra√Æn√©
model = torchvision.models.resnet18(pretrained=True)
model.eval()

# Exemple d'input (3 canaux, 224x224)
dummy_input = torch.randn(1, 3, 224, 224)

# Export ONNX
torch.onnx.export(
    model,
    dummy_input,
    "resnet18.onnx",
    input_names=["input"],
    output_names=["output"],
)

FastAPI et ONNX :

Un duo puissant pour le d√©ploiement de mod√®les ML
En tant que data scientist, la combinaison de FastAPI et ONNX peut consid√©rablement optimiser votre pipeline de d√©ploiement de mod√®les. Voici comment ces deux technologies interagissent :

üîó Relation entre FastAPI et ONNX
FastAPI et ONNX sont compl√©mentaires mais servent des objectifs diff√©rents :

FastAPI : Framework pour cr√©er des APIs web performantes (couche de service)

ONNX (Open Neural Network Exchange) : Format ouvert pour repr√©senter des mod√®les ML (couche d'inf√©rence)

üöÄ Pourquoi utiliser ONNX avec FastAPI ?
Interop√©rabilit√© :

ONNX permet d'exporter des mod√®les depuis diff√©rents frameworks (PyTorch, TensorFlow, scikit-learn)

FastAPI expose ces mod√®les via une API standardis√©e

Performance optimis√©e :

Les mod√®les ONNX s'ex√©cutent plus vite gr√¢ce √† des optimisations sp√©cifiques

FastAPI g√®re efficacement les requ√™tes entrantes

D√©ploiement multiplateforme :

ONNX fonctionne sur CPU/GPU et diff√©rents environnements

FastAPI fournit une interface REST ind√©pendante de la plateforme

Exemple concret d'int√©gration

In [None]:
from fastapi import FastAPI
import onnxruntime as ort
import numpy as np

app = FastAPI()

# Chargement du mod√®le ONNX
sess = ort.InferenceSession("modele.onnx")
input_name = sess.get_inputs()[0].name

@app.post("/predict")
async def predict(input_data: list):
    """Endpoint pour les pr√©dictions ONNX"""
    # Conversion des donn√©es d'entr√©e
    input_array = np.array(input_data, dtype=np.float32)

    # Inf√©rence ONNX
    outputs = sess.run(None, {input_name: input_array})

    return {"prediction": outputs[0].tolist()}

Workflow typique Data Science avec ONNX + FastAPI

Entra√Ænement :

D√©veloppez votre mod√®le dans PyTorch/TensorFlow/scikit-learn

Conversion vers ONNX :

python
Copy
torch.onnx.export(model, dummy_input, "modele.onnx")
D√©ploiement avec FastAPI :

Cr√©ez une API autour du mod√®le ONNX

B√©n√©ficiez des performances accrues d'ONNX Runtime

Consommation :

L'API peut √™tre appel√©e par des applications web/mobiles

‚ö° Avantages cl√©s de cette combinaison
Latence r√©duite : Jusqu'√† 10x plus rapide qu'un mod√®le Python natif

Compatibilit√© √©tendue : Fonctionne m√™me avec des mod√®les entra√Æn√©s sur d'autres plateformes

√âconomie de ressources : Moins de CPU/m√©moire utilis√©s

Maintenance simplifi√©e : Un seul format de mod√®le √† g√©rer

üõ†Ô∏è Outils compl√©mentaires utiles
ONNX Runtime : Moteur d'ex√©cution optimis√© pour les mod√®les ONNX

Hummingbird : Convertit les mod√®les sklearn en ONNX

Docker : Pour containeriser votre API FastAPI + mod√®le ONNX

Cette combinaison est particuli√®rement utile quand vous avez besoin :

De performances √©lev√©es en production

De d√©ployer des mod√®les sur diff√©rentes plateformes

D'une solution standardis√©e pour servir diff√©rents types de mod√®les



Deployer un modele Pytorch to Fast API


In [None]:
import torch
import torchvision

# 1. Charger ResNet-18 pr√©-entra√Æn√©
model = torchvision.models.resnet18(pretrained=True)
model.eval()  # Mode √©valuation

# 2. Exemple de donn√©es (batch=1, RGB, 224x224)
dummy_input = torch.randn(1, 3, 224, 224)

# 3. Test du mod√®le avant export
output = model(dummy_input)
print("Classe pr√©dite:", torch.argmax(output, dim=1).item())

Downloading: "https://download.pytorch.org/models/resnet18-f37072fd.pth" to /root/.cache/torch/hub/checkpoints/resnet18-f37072fd.pth
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 44.7M/44.7M [00:00<00:00, 111MB/s]


Classe pr√©dite: 107


Th√©orie ONNX :

ONNX a besoin d'un exemple d'input pour :

Tracer le graphe de calcul

D√©terminer les shapes des tensors interm√©diaires

Valider que toutes les op√©rations sont support√©es

In [None]:
# Export ONNX avec batch dynamique
torch.onnx.export(
    model,
    dummy_input,
    "resnet18.onnx",
    input_names=["input"],
    output_names=["output"],
    dynamic_axes={"input": {0: "batch_size"}, "output": {0: "batch_size"}},
    opset_version=11
)


Ce qui se passe pendant l'export :

Tracing :

PyTorch ex√©cute le mod√®le avec dummy_input

Enregistre toutes les op√©rations effectu√©es

Cr√©e un graphe de calcul (DAG)

Validation :

V√©rifie que toutes les op√©rations sont support√©es par ONNX

Certaines op√©rations PyTorch complexes peuvent n√©cessiter des adaptations

S√©rialisation :

Le graphe + poids sont sauvegard√©s au format protobuf (.onnx)

Points d'attention importants :

Compatibilit√© des op√©rations :

Certaines couches PyTorch n'ont pas d'√©quivalent direct ONNX

Solution : r√©impl√©menter avec des op√©rations de base

Contr√¥le de flux :

Les boucles/conditions natives Python ne sont pas exportables

Utiliser torch.jit.script pour les mod√®les avec logique complexe

Shape Inference :

ONNX doit pouvoir d√©duire toutes les shapes interm√©diaires

Probl√®mes fr√©quents avec les op√©rations de reshape dynamique

In [None]:
import onnx

# Charger le mod√®le
onnx_model = onnx.load("resnet18.onnx")

# Valider le sch√©ma
onnx.checker.check_model(onnx_model)

# Afficher le graphe
print(onnx.helper.printable_graph(onnx_model.graph))

ModuleNotFoundError: No module named 'onnx'

Cr√©er une API avec FastAPI

In [None]:
!pip install onnx
!pip install fastapi
!pip install onnxruntime

Collecting onnxruntime
  Downloading onnxruntime-1.21.0-cp311-cp311-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl.metadata (4.5 kB)
Collecting coloredlogs (from onnxruntime)
  Downloading coloredlogs-15.0.1-py2.py3-none-any.whl.metadata (12 kB)
Collecting humanfriendly>=9.1 (from coloredlogs->onnxruntime)
  Downloading humanfriendly-10.0-py2.py3-none-any.whl.metadata (9.2 kB)
Downloading onnxruntime-1.21.0-cp311-cp311-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl (16.0 MB)
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m16.0/16.0 MB[0m [31m72.3 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading coloredlogs-15.0.1-py2.py3-none-any.whl (46 kB)
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m46.0/46.0 kB[0m [31m2.8 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading humanfriendly-10.0-py2.py3-none-any.w

In [None]:
from fastapi import FastAPI, File, UploadFile
import numpy as np
import onnxruntime as ort
from PIL import Image
import io
import urllib.request


app = FastAPI()


# Charger le mod√®le ONNX
sess = ort.InferenceSession("resnet18.onnx")

def preprocess_image(image_bytes):
    img = Image.open(io.BytesIO(image_bytes))
    img = img.resize((224, 224))  # Resize selon le mod√®le
    img = np.array(img).transpose(2, 0, 1)  # CHW format
    img = img.astype(np.float32) / 255.0  # Normaliser
    img = np.expand_dims(img, axis=0)  # Ajouter batch dimension
    return img

@app.post("/predict")
async def predict(file: UploadFile = File(...)):
    # Lire l'image upload√©e
    image_bytes = await file.read()

    # Pr√©traiter l'image
    input_tensor = preprocess_image(image_bytes)

    # Faire la pr√©diction
    outputs = sess.run(
        None,
        {"input": input_tensor}
    )

    # Traiter les outputs (ex: obtenir la classe pr√©dite)
    predicted_class = np.argmax(outputs[0])

    return {"predicted_class": int(predicted_class)}

if __name__ == "__main__":
    import uvicorn
    uvicorn.run(app, host="0.0.0.0", port=8000)

HTTPError: HTTP Error 404: Not Found