# **Industrialisation et MLOps sur Microsoft Azure**

<img src='https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcR8cSAbbthmBHXpIZaYW6hNpMfMkXvhRP7P5w&s' width=500>

L'objectif de cette s√©ance est de sortir du cadre local pour b√¢tir une **infrastructure MLOps compl√®te et scalable** sur le cloud Azure. Nous allons passer d'un simple script d'entra√Ænement √† une architecture interconnect√©e capable de g√©rer le cycle de vie d'un mod√®le de bout en bout : stockage, base de donn√©es, suivi d'exp√©riences et calcul haute performance.

Au cours de ce notebook, nous allons orchestrer les services suivants :

1.  **Calcul et Entra√Ænement (Compute Plane) :** Utilisation d'une **Machine Virtuelle (VM) Azure** d√©di√©e, configur√©e avec Docker, pour lancer des entra√Ænements intensifs qui communiqueront automatiquement leurs r√©sultats vers notre serveur MLflow distant.
2.  **Gestion des ressources :** Utilisation de l'**extension Azure pour VS Code** pour cr√©er et monitorer nos services sans quitter notre environnement de d√©veloppement.
3.  **Persistance des donn√©es :**
    *   D√©ploiement d'une base de donn√©es **PostgreSQL sur Azure** pour stocker les m√©tadonn√©es de MLflow.
    *   Configuration d'un **Azure Blob Storage** pour servir de "Artifact Store" (stockage des mod√®les et des datasets volumineux).
4.  **Azure Web App (for Containers)** : D√©ploiement d'un serveur **MLflow** conteneuris√© via . Ce serveur centralisera tous nos logs d'entra√Ænement.




### **Connexion √† Azure et Installation des outils**

Avant de d√©ployer nos services, nous devons pr√©parer notre environnement de d√©veloppement pour qu'il puisse "parler" avec l'infrastructure de Microsoft Azure.

Vous avez re√ßu un e-mail de la part de Microsoft Azure (v√©rifiez vos courriers ind√©sirables). 
1. Cliquez sur le lien d'acceptation dans l'e-mail pour rejoindre le **compte de facturation de l'intervenant**.
2. Cela vous donnera les droits n√©cessaires pour cr√©er des ressources (Web App, PostgreSQL, VM) sans avoir √† renseigner votre propre carte bancaire.
3. Une fois accept√©, connectez-vous au portail [portal.azure.com](https://portal.azure.com).

4. Nous allons utiliser Python pour interagir avec le stockage Azure (Blob Storage) et g√©rer le cycle de vie de nos mod√®les avec MLflow. Ex√©cutez la cellule suivante pour installer les d√©pendances n√©cessaires :

*   `azure-storage-blob` : Pour envoyer/t√©l√©charger des fichiers (mod√®les, datasets) sur le cloud.
*   `psycopg2-binary` : Pour permettre √† MLflow de communiquer avec notre base de donn√©es PostgreSQL.

In [None]:
# Installation des librairies pour Azure : azure-storage-blob psycopg2-binary


5. Configuration de VS Code
L'extension Azure permet de g√©rer vos ressources (d√©marrer/arr√™ter une VM, voir les logs d'une Web App) directement depuis votre √©diteur.

6.  **Installation :** Allez dans l'onglet "Extensions" de VS Code et installez le pack **[Azure Tools](https://marketplace.visualstudio.com/items?itemName=ms-vscode.vscode-node-azure-pack)**.
7.  **Connexion :**
    *   Cliquez sur l'ic√¥ne Azure qui vient d'appara√Ætre dans votre barre lat√©rale gauche.
    *   Cliquez sur **"Sign in to Azure..."**.
    *   Une fen√™tre de navigateur s'ouvre : connectez-vous avec le compte sur lequel vous avez re√ßu l'invitation.
8.  **S√©lection de l'abonnement :**
    *   Une fois connect√©, assurez-vous de s√©lectionner l'abonnement **Ynov 2026** li√© au cours.

## **2. D√©ploiement d'une application Web (Streamlit)**

Avant de d√©ployer des syst√®mes complexes comme MLflow, nous allons commencer par d√©ployer une interface utilisateur simple avec **Streamlit**. Azure App Service (Web App) permet d'h√©berger des applications Python tr√®s facilement.

#### **2.1. Pr√©paration des fichiers locaux**

Pour qu'Azure sache comment faire tourner votre application, vous avez besoin de deux fichiers : le code (`app.py`) et la liste des d√©pendances (`requirements.txt`).

**√âtape 1 : Cr√©er le fichier `app.py`**
Dans votre dossier de projet, cr√©ez un fichier `app.py` et collez le code suivant :


In [None]:
import streamlit as st

st.title("Azure Deploy : Succ√®s ! ‚úÖ")
st.write("Cette application Streamlit est h√©berg√©e sur Azure Web Apps.")
st.info("F√©licitations, vous venez de d√©ployer votre premier service cloud.")

C'est un excellent choix. Passer par Docker est la m√©thode la plus robuste ("Cloud Native") car elle garantit que votre application fonctionnera exactement de la m√™me mani√®re sur Azure que sur votre PC, sans se soucier des probl√®mes de d√©pendances ou de fichiers manquants.


#### **√âtape 2 : Cr√©er le fichier `Dockerfile`**

Le `Dockerfile` est la recette de cuisine qui permet de construire l'image de votre application. Cr√©ez un fichier nomm√© exactement `Dockerfile` (sans extension) √† la racine de votre projet :


In [None]:
FROM python:3.13-slim

RUN pip install streamlit

WORKDIR /app

CMD ["streamlit", "run", "app.py", "--server.port=8501", "--server.address=0.0.0.0"]

#### **√âtape 3 : Construction et publication de l'image**

Nous allons maintenant transformer ce fichier en une image et l'envoyer sur **Docker Hub** pour qu'Azure puisse la r√©cup√©rer.

In [None]:
# Connexion √† Docker Hub
docker login

In [None]:
#Construction de l'image
docker build -t votre_pseudo/streamlit .

In [None]:
#Publication de l'image
docker push votre_pseudo/streamlit

#### **√âtape 4 : D√©ploiement sur Azure Web App for Containers**

Maintenant que l'image est sur le Cloud (Docker Hub), nous allons dire √† Azure de l'utiliser.

1.  **Cr√©ation de la ressource :**
    *   Allez sur le [Portail Azure](https://portal.azure.com).
    *   Cliquez sur **"Cr√©er une ressource"** -> **"Web App"**.
2.  **Configuration de base :**
    *   *Nom :* Un nom unique (ex: `ia-cloud-docker-votre-nom`).
    *   *Publier :* S√©lectionnez **Conteneur Docker**.
    *   *Syst√®me d'exploitation :* **Linux**.
    *   *R√©gion :* **France Central** ou **West Europe**.
3.  **Configuration du conteneur (Onglet Docker) :**
    *   *Source d'image :* **Docker Hub**.
    *   *Type d'acc√®s :* **Public**.
    *   *Image et balise :* Tapez `votre_pseudo/streamlit-azure:latest`.
4.  **Finalisation :**
    *   Cliquez sur **Review + Create** puis **Create**.


#### **√âtape 5 : Configuration du Port sur Azure**

Azure doit savoir que votre conteneur √©coute sur le port **8501**.

1.  Une fois la Web App cr√©√©e, allez dans **Configuration** (menu de gauche).
2.  Dans l'onglet **Application settings**, cliquez sur **+ New application setting**.
3.  Ajoutez la variable suivante :
    *   **Nom :** `WEBSITES_PORT`
    *   **Valeur :** `8501`
4.  Cliquez sur **OK** puis **Save**.


# **3 : Azure Blob Storage ‚Äî G√©rer vos donn√©es dans le Cloud**

<img src='https://cdn-dynmedia-1.microsoft.com/is/image/microsoftcorp/Introduction-to-Azure-Blob-Storage_tbmnl_en-us?scl=1' width=400>


Le **Blob Storage** est le service de stockage d'objets d'Azure (√©quivalent de AWS S3). Il est id√©al pour stocker des datasets, des images, des logs ou des fichiers de mod√®les s√©rialis√©s (`.pkl`, `.h5`, `.onnx`).



### **Etape 1. Cr√©ation du stockage via VS Code**

Plut√¥t que d'utiliser le portail web, nous allons utiliser l'extension **Azure Tools** :
1. Cliquez sur l'ic√¥ne **Azure** dans la barre lat√©rale.
2. D√©roulez votre abonnement et cherchez **Storage**.
3. Faites un clic droit sur **Storage Accounts** -> **Create Storage Account... (Advanced)**.
4. Suivez les √©tapes :
   * **Nom :** Un nom unique en minuscules et chiffres uniquement (ex: `ynov-prenom`).
   * **Performance :** Standard.
   * **Replication :** LRS (le moins cher).
5. Une fois cr√©√©, faites un clic droit sur votre nouveau compte de stockage -> **Copy Connection String**. C'est cette cl√© qui nous permettra de nous connecter en Python.

In [None]:
from azure.storage.blob import BlobServiceClient

storage_account_key = ""
storage_account_name = ""
connection_string = ""
container_name = ""

### **Etape 2. Manipulation du stockage avec Python**

Nous allons configurer nos acc√®s et d√©finir nos fonctions de base pour l'upload et le download.

In [3]:
from azure.storage.blob import BlobServiceClient
import os

# Initialisation du client de service
blob_service_client = BlobServiceClient.from_connection_string(connection_string)

# Fonction pour uploader un fichier
def uploadToBlobStorage(file_path, file_name):
    blob_client = blob_service_client.get_blob_client(container=container_name, blob=file_name)
    with open(file_path, "rb") as data:
        blob_client.upload_blob(data, overwrite=True) # overwrite=True √©vite les erreurs si le fichier existe d√©j√†
        print(f"‚úÖ Fichier {file_name} upload√© avec succ√®s.")


# Fonction pour t√©l√©charger un fichier
def download_blob_to_file(file_name, download_path):
    blob_client = blob_service_client.get_blob_client(container=container_name, blob=file_name)
    with open(file=download_path, mode="wb") as sample_blob:
        download_stream = blob_client.download_blob()
        sample_blob.write(download_stream.readall())
        print(f"‚úÖ Fichier {file_name} t√©l√©charg√© vers {download_path}.")

In [None]:
# Test des fonctions


‚úÖ Fichier requirements.txt upload√© avec succ√®s.


In [None]:
# Test des fonctions

‚úÖ Fichier requirements.txt t√©l√©charg√© vers downloaded_requirements.txt.


> √Ä vous de jouer ! Compl√©tez les fonctions suivantes pour automatiser la gestion de vos ressources.
Sources = https://learn.microsoft.com/en-us/azure/storage/blobs/storage-blob-python-get-started?tabs=azure-ad


#### **Exercice 1 : Lister les fichiers d'un container**
Cr√©ez la fonction qui affiche le nom de chaque fichier (blob) pr√©sent dans votre container.

In [None]:
def list_blobs_in_container(container_name):
    ...
    return files

# Test :
# mes_fichiers = list_blobs_in_container(container_name)

#### **Exercice 2 : T√©l√©chargement intelligent**
Cr√©ez une fonction qui r√©cup√®re la liste des fichiers et t√©l√©charge automatiquement le premier fichier trouv√© qui correspond √† une extension sp√©cifique (ex: `.jpg`).

In [None]:
def download_first_match(extension):
    ...
    return download_path

# **Projet : D√©ploiement de MLflow sur Azure**

### **1. Le Dockerfile (`mlflow-azure`)**
Cr√©ez un `Dockerfile` qui installe MLflow et le connecteur Azure.

```dockerfile
FROM python:3.13-slim

RUN pip install mlflow azure-storage-blob psycopg2-binary

# Port par d√©faut de MLflow
EXPOSE 5000

# Commande de lancement (on utilise le Blob Storage pour les artefacts)
# Remplacez <votre_container> et <votre_compte> ou utilisez des variables d'env
CMD mlflow server \
    --host 0.0.0.0 \
    --port 5000 \
    --artifacts-destination wasbs://${AZURE_CONTAINER}@${AZURE_STORAGE_ACCOUNT}.blob.core.windows.net/ \
    --allowed-hosts "*" 
```

**Action :** Buildez et pushez l'image :
`docker build -t pseudo/mlflow-azure .`  
`docker push pseudo/mlflow-azure`


### **2. D√©ploiement sur Azure Web App**
1.  Cr√©ez une **Web App for Containers** (nom : `ynov-nom-mlflow`).
2.  Configurez l'image sur `pseudo/mlflow-azure`.
3.  **Variables d'environnement (Configuration) :** Ajoutez ces cl√©s indispensables :
    *   `AZURE_STORAGE_CONNECTION_STRING` : Votre cha√Æne de connexion compl√®te.
    *   `AZURE_STORAGE_ACCOUNT` : Le nom de votre compte de stockage.
    *   `AZURE_CONTAINER` : Le nom de votre blob container.
    *   `WEBSITES_PORT` : `5000`.


### **3. Test : Loguer un mod√®le √† distance**
Une fois que votre URL MLflow est en ligne, utilisez votre conteneur d'entrainement pour v√©rifier que tout se d√©roule correctement et que les fichiers apparaissent sur le blob storage.

# **4 : Machine Virtuelle (VM)**

Pourquoi une VM ? Alors que la Web App est parfaite pour l'interface (MLflow), une **VM** est indispensable pour les entra√Ænements longs, gourmands en RAM ou n√©cessitant des **GPUs**.

### **Etape 1. Cr√©ation de la VM via VS Code et instalation de docker**
1.  Dans l'extension Azure de VS Code, cherchez **Virtual Machines**.
2.  Faites un clic droit -> **Create Virtual Machine... (Advanced)**.
3.  **Configuration :**
    *   **Image :** Ubuntu 22.04 LTS (Standard).
    *   **Size :** `Standard_D2s_v3` (ou une taille gratuite/√©co type `B1s`).
    *   **Security :** Choisissez **SSH Key** (VS Code la g√©n√©rera pour vous) ou **Password**.
    *   **Ports :** Assurez-vous que le port **22 (SSH)** est ouvert.

4. Une fois la VM cr√©√©e, faites un clic droit dessus dans VS Code -> **Connect to Host** (ou utilisez le terminal SSH). Une fois "dans" la VM, installez Docker avec ces commandes rapides :

In [None]:
sudo apt-get update
sudo apt-get install -y docker.io
sudo systemctl start docker
sudo usermod -aG docker $USER

### **Etape 3. Lancement de l'entra√Ænement conteneuris√©**
Nous allons lancer un conteneur qui va entra√Æner un mod√®le sur la VM et envoyer les r√©sultats √† votre serveur MLflow (Web App).

Utilisez l'image docker d'entrainement en utilisant l'url de votre server mlflow pour enregistrer le mod√®le ainsi que les m√©triques.

In [None]:
# Demarrage du conteneur avec la variable d'environnement pour le tracking MLflow
docker run -it -e MLFLOW_TRACKING_URI="url_appweb_azure_mlflow" pseudo/mlflow-training

### **Etape 4. √âvolution : Int√©gration de PostgreSQL**
Actuellement, votre MLflow stocke les m√©tadonn√©es dans un fichier local (perdu au red√©marrage). Pour un vrai MLflow industriel, il nous faut une **Base de Donn√©es PostgreSQL** pour que les donn√©es soient persistantes.

**Modification du Dockerfile (MLflow) :**
Pour connecter MLflow √† Postgres, la commande de d√©marrage dans le conteneur doit devenir :

In [None]:
mlflow server \
    --host 0.0.0.0 \
    --port 5000 \
    --backend-store-uri postgresql://mlflow:Ynov2026@mlflow-ynov.postgres.database.azure.com:5432/postgres?sslmode=require \
    --artifacts-destination wasbs://${AZURE_CONTAINER}@${AZURE_STORAGE_ACCOUNT}.blob.core.windows.net/ \
    --allowed-hosts "*"

# **Projet : Entra√Ænement d'un CNN sur Azure**

C'est l'heure de mettre en pratique toute l'architecture que vous avez mont√©e depuis le d√©but. On va sortir des petits mod√®les de test pour s'attaquer √† du Deep Learning un peu plus costaud : la classification d'images (chiens vs chats).

L'objectif est simple : votre PC ne doit rien calculer. Tout va se passer dans un conteneur sur votre VM Azure, et les r√©sultats seront envoy√©s en direct sur votre serveur MLflow.

### üéØ **Le challenge**
Vous devez entra√Æner un r√©seau de neurones √† convolution (CNN) en utilisant le dataset "Cat-Dog-Dataset" disponible sur le GitHub du cours. 

### **Ce que vous devez faire :**

**1. Pr√©parer l'image d'entra√Ænement**
Vous allez devoir cr√©er un nouveau Dockerfile. Cette image doit √™tre une v√©ritable "box" autonome : elle doit contenir Python, TensorFlow, les outils pour communiquer avec Azure et MLflow, mais aussi cloner automatiquement le dataset depuis GitHub. Votre script d'entra√Ænement (fourni plus haut) devra √™tre int√©gr√© √† cette image.

**2. Automatiser le tracking**
N'oubliez pas d'int√©grer la fonction d'autologging de MLflow dans votre script. On veut que TensorFlow envoie tout seul les courbes d'accuracy et de loss sur votre Web App Azure pendant que la machine travaille.

**3. Envoyer l'image sur Docker Hub**
Une fois que votre recette (Dockerfile) est pr√™te, buildez votre image localement et poussez-la sur votre compte Docker Hub. C'est ce qui permettra √† votre VM de la r√©cup√©rer en un instant.

**4. Allumer le "muscle" (La VM)**
Connectez-vous √† votre VM Azure via VS Code. C'est ici que le calcul va se faire. Assurez-vous que Docker est bien install√© et pr√™t √† l'emploi.

**5. Lancer le calcul**
C'est le moment de v√©rit√©. Lancez votre conteneur sur la VM. Attention : vous devrez passer les informations de connexion (l'URL de votre MLflow et vos cl√©s de stockage) sous forme de variables d'environnement au moment du lancement du conteneur. Sans √ßa, votre VM travaillera dans le vide et ne pourra rien sauvegarder !

### ‚úÖ **Comment valider votre projet ?**
Le travail est consid√©r√© comme r√©ussi si :
1. On voit l'entra√Ænement tourner dans les logs de votre VM.
2. Un nouveau projet appara√Æt sur votre interface MLflow avec des graphiques qui bougent en temps r√©el.
3. Le mod√®le final (le fichier d'entra√Ænement termin√©) est bien pr√©sent dans votre Blob Storage √† la fin du processus.

### **1. Chargement des fichiers**

In [None]:
!git clone https://github.com/Mickevin/Cat-Dog-Dataset.git

In [None]:
import os
import pandas as pd


path = 'Cat-Dog-Dataset/train/'
list_dir = os.listdir(path)


# Cr√©ez un DataFrame avec les noms des images et les labels correspondants
df = pd.DataFrame(os.listdir('Cat-Dog-Dataset/train'), columns=['filename'])
df['label'] = ['1' if 'cat' in name else '0' for name in df['filename']]

# Cr√©ez un DataFrame avec les noms des images et les labels correspondants
df_val = pd.DataFrame(os.listdir('Cat-Dog-Dataset/validation'), columns=['filename'])
df_val['label'] = ['1' if 'cat' in name else '0' for name in df_val['filename']]


### **2. Conception du mod√®le CNN**

In [None]:
from tensorflow.keras.layers import Dense, Conv2D, MaxPooling2D, Flatten, Dropout
from tensorflow.keras.models import Sequential

# Conception d'un mod√®le de r√©seau de neuronne √† convolution
model = Sequential([
    Conv2D(filters=32, kernel_size=(3, 3), activation='relu', input_shape=(250, 250, 3)),
    Dropout(0.4),
    MaxPooling2D(pool_size=(2, 2)),

    Conv2D(filters=64, kernel_size=(3, 3), activation='relu'),
    Dropout(0.4),
    MaxPooling2D((2, 2)),

    Conv2D(filters=64, kernel_size=(3, 3), activation='relu'),
    Dropout(0.4),
    Flatten(),

    Dense(units=32, activation='relu'),
    Dense(units=1, activation='sigmoid')
])

# Compilation du mod√®le
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Affichage de la structure du mod√®le
model.summary()

### **3. Entrainement du mod√®le**

In [None]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# Cr√©ez un g√©n√©rateur d'images √† partir du DataFrame
datagen = ImageDataGenerator(rescale=1./255)  # R√©√©chelonne les valeurs des pixels entre 0 et 1

# G√©n√©rateur d'images √† partir du DataFrame
generator = datagen.flow_from_dataframe(
    dataframe=df[:5000],
    directory=path,
    x_col='filename',
    y_col='label',
    target_size=(250, 250),
    class_mode='binary',
    batch_size=32
)

generator_val = datagen.flow_from_dataframe(
    dataframe=df_val[:100],
    directory='Cat-Dog-Dataset/validation/',
    x_col='filename',
    y_col='label',
    target_size=(250, 250),
    class_mode='binary',
    batch_size=32
)


# Entra√Ænez le mod√®le en utilisant le g√©n√©rateur d'images
history = model.fit(generator, epochs=10,validation_data=generator_val)