# Tutoriel : Classification Binaire avec Linear Learner et Amazon SageMaker üéì

Ce tutoriel va vous guider pas √† pas pour :
- Comprendre le mod√®le **Linear Learner** üìà pour la classification.
- Pr√©parer et analyser le jeu de donn√©es **MNIST** üñåÔ∏è.
- Entra√Æner, d√©ployer et valider un mod√®le pour d√©tecter si un chiffre manuscrit est un z√©ro ou non.
- Appliquer des m√©thodes avanc√©es comme le **tuning d'hyperparam√®tres** pour am√©liorer les performances du mod√®le.

---

#### 1Ô∏è‚É£ Introduction au Linear Learner üìù

Le mod√®le **Linear Learner** d‚ÄôAmazon SageMaker est con√ßu pour r√©soudre des probl√®mes de **classification binaire** et de **r√©gression lin√©aire**. Ce mod√®le :
- Apprend une fonction lin√©aire pour pr√©dire si un chiffre est un z√©ro ou un autre chiffre.
- Est particuli√®rement efficace en **parall√©lisant** plusieurs mod√®les avec diff√©rents hyperparam√®tres.

**Challenge** üåü: Pourquoi utilise-t-on le **Linear Learner** pour la classification binaire ?

**R√©ponse** : Le **Linear Learner** est rapide et bien adapt√© aux grandes donn√©es avec des classes bien s√©parables, comme ici o√π on distingue z√©ro des autres chiffres.

#### 2Ô∏è‚É£ Pr√©-requis et Pr√©-traitement des Donn√©es üõ†Ô∏è

Nous allons pr√©parer l‚Äôenvironnement pour le stockage des donn√©es et les autorisations d'acc√®s. 

Amazon SageMaker utilise des r√¥les IAM pour acc√©der aux donn√©es stock√©es dans Amazon S3 et pour les services d‚Äôentra√Ænement et de d√©ploiement.

In [None]:
# Configurer les autorisations et les variables d'environnement
import sagemaker

role = sagemaker.get_execution_role()  # R√¥le IAM pour l'acc√®s SageMaker
sess = sagemaker.Session()  # Session SageMaker

# Sp√©cifier les chemins S3 pour l'entra√Ænement et le mod√®le
bucket = sess.default_bucket()
prefix = 'sagemaker/mnist-linear-learner'

**Challenge** üåü: Pourquoi configurons-nous un r√¥le IAM pour cette session SageMaker ?

**R√©ponse** : Le r√¥le IAM permet √† SageMaker d'acc√©der aux donn√©es stock√©es dans S3 et d'utiliser les ressources n√©cessaires pour l‚Äôentra√Ænement et le d√©ploiement du mod√®le.

#### 3Ô∏è‚É£ Ingestion et Pr√©paration des Donn√©es üñºÔ∏è

Nous utilisons le jeu de donn√©es **MNIST** qui contient des images de chiffres manuscrits. Chaque image est une matrice de 28x28 pixels en √©chelle de gris.

Nous allons t√©l√©charger et pr√©parer ces donn√©es pour entra√Æner notre mod√®le de classification binaire.

In [None]:
# T√©l√©chargement et traitement des donn√©es MNIST
from sagemaker.amazon.amazon_estimator import RecordSet
import numpy as np

# Simuler les donn√©es (Exemple de code simplifi√© pour les explications)
data = np.random.randint(0, 255, (1000, 784))
labels = np.random.randint(0, 2, 1000)
record_set = RecordSet(data, labels)

**Challenge** üåü: Pourquoi transformons-nous les images en un format compatible avec SageMaker ?

**R√©ponse** : Le format requis par SageMaker est optimis√© pour un traitement rapide lors de l'entra√Ænement, et permet une compatibilit√© directe avec les algorithmes int√©gr√©s comme Linear Learner.

#### 4Ô∏è‚É£ Entra√Ænement du Mod√®le Linear Learner üß†

Nous allons maintenant configurer et entra√Æner un mod√®le de **Linear Learner** sur les donn√©es pr√©par√©es.

Le Linear Learner peut effectuer une **classification binaire**, ce qui est parfait pour notre objectif.

In [None]:
# Entra√Æner le mod√®le Linear Learner avec SageMaker
from sagemaker.amazon.linear_learner import LinearLearner

linear = LinearLearner(role=role, instance_count=1, instance_type='ml.m4.xlarge', predictor_type='binary_classifier')

# Entra√Æner le mod√®le
linear.fit(record_set)

**Challenge** üåü: Pourquoi pr√©cisons-nous `predictor_type='binary_classifier'` lors de la cr√©ation du mod√®le ?

**R√©ponse** : `predictor_type='binary_classifier'` indique que le mod√®le est entra√Æn√© pour une classification binaire, adapt√©e √† notre objectif de pr√©dire si une image repr√©sente un z√©ro ou un autre chiffre.

#### 5Ô∏è‚É£ D√©ploiement et Validation du Mod√®le üöÄ

Une fois l'entra√Ænement termin√©, nous d√©ployons le mod√®le pour faire des pr√©dictions sur de nouvelles donn√©es.

In [None]:
# D√©ploiement du mod√®le sur un point de terminaison SageMaker
predictor = linear.deploy(initial_instance_count=1, instance_type='ml.m4.xlarge')

# Exemple de pr√©diction avec des donn√©es de test
result = predictor.predict(data[:5])  # Pr√©diction sur un √©chantillon
print(result)

**Challenge** üåü: Que signifie `initial_instance_count=1` dans le d√©ploiement du mod√®le ?

**R√©ponse** : `initial_instance_count=1` signifie que le mod√®le sera d√©ploy√© sur une seule instance, suffisant pour un test initial ou des charges de travail l√©g√®res.

#### üöÄ Conclusion üéâ

F√©licitations ! üéâ Vous avez appris √† :
- Configurer un environnement Amazon SageMaker
- Pr√©parer et analyser des donn√©es pour la classification
- Entra√Æner, d√©ployer et valider un mod√®le de classification binaire avec **Linear Learner**.

**Challenge final** üåü: Comment feriez-vous pour am√©liorer les performances de ce mod√®le ?

**R√©ponse** : Pour am√©liorer les performances, nous pourrions explorer le tuning d‚Äôhyperparam√®tres ou essayer d‚Äôautres architectures de mod√®les plus complexes pour comparer les r√©sultats.

Merci d'avoir suivi ce tutoriel ! üòä