---

### üìú Licence d'utilisation

Ce document est prot√©g√© sous licence **Creative Commons BY-NC-ND 4.0 International**  
üîí **Aucune modification ni r√©utilisation sans autorisation explicite de l'auteur.**

- üë§ Auteur : Christie Vassilian  
- üì• T√©l√©chargement autoris√© uniquement √† usage p√©dagogique personnel  
- üö´ R√©utilisation commerciale ou modification interdite  

[![Licence CC BY-NC-ND](https://licensebuttons.net/l/by-nc-nd/4.0/88x31.png)](https://creativecommons.org/licenses/by-nc-nd/4.0/)

---

# üî¢ Activit√© : Comprendre ce qu'est un Classificateur Lin√©aire

# TP IA n¬∞1 : Classification Lin√©aire

## üéØ Objectif
- Comprendre ce qu‚Äôest un **classificateur lin√©aire** et ses limites.  
- Introduire les notions de fronti√®re de d√©cision, de s√©parabilit√© et d‚Äô√©valuation d‚Äôun mod√®le.  

---

¬© 2025 Christie Vassilian.  
Ce document est prot√©g√© par la licence **CC BY-NC-ND 4.0** :  
- Toute utilisation commerciale est interdite.  
- Aucune modification ou diffusion n‚Äôest autoris√©e sans l‚Äôautorisation √©crite de l‚Äôauteur.  
- Seul un usage strictement personnel est permis.  


# üåü Classificateur Lin√©aire Simplifi√©

Ce notebook te permet de comprendre ce qu‚Äôest un **classificateur lin√©aire**.  
Nous allons :
- Cr√©er des donn√©es simples en 2D
- Tracer les points
- Apprendre un classificateur lin√©aire
- Visualiser la fronti√®re de s√©paration

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

## üîß G√©n√©ration de donn√©es

## üë• Exemple r√©aliste : pr√©dire Homme ou Femme √† partir de la taille et du poids

In [None]:
# Simulation : taille en cm et poids en kg
np.random.seed(1)

# Hommes : taille moyenne 175 cm, poids moyen 75 kg
taille_h = np.random.normal(175, 6, 50)
poids_h = np.random.normal(75, 8, 50)

# Femmes : taille moyenne 162 cm, poids moyen 62 kg
taille_f = np.random.normal(162, 5, 50)
poids_f = np.random.normal(62, 6, 50)

X = np.vstack((np.column_stack((taille_h, poids_h)),
               np.column_stack((taille_f, poids_f))))
y = np.array([0]*50 + [1]*50)  # 0 : Homme, 1 : Femme

In [None]:
# üîé Visualisation des donn√©es brutes (avant apprentissage)
plt.scatter(X[:, 0], X[:, 1], c=y, cmap='bwr', edgecolors='k')
plt.xlabel("Taille (cm)")
plt.ylabel("Poids (kg)")
plt.title("Donn√©es : taille et poids selon le genre")
plt.grid(True)
plt.show()

In [None]:
model = LogisticRegression()
model.fit(X, y)
print("Score de pr√©cision :", model.score(X, y))

### üîç Visualisation du r√©sultat

Nous affichons maintenant :
- Les points (taille, poids) color√©s selon la classe (homme ou femme),
- Et la **fronti√®re de s√©paration** calcul√©e par le mod√®le de r√©gression logistique.

## ‚úèÔ∏è Visualisation de la fronti√®re

In [None]:
# Visualisation de la fronti√®re adapt√©e aux donn√©es
x_min, x_max = X[:, 0].min() - 2, X[:, 0].max() + 2
y_min, y_max = X[:, 1].min() - 2, X[:, 1].max() + 2

xx, yy = np.meshgrid(np.linspace(x_min, x_max, 200),
                     np.linspace(y_min, y_max, 200))
grid = np.c_[xx.ravel(), yy.ravel()]
probs = model.predict_proba(grid)[:, 1].reshape(xx.shape)

plt.contourf(xx, yy, probs, levels=[0, 0.5, 1], cmap="bwr", alpha=0.2)
plt.scatter(X[:, 0], X[:, 1], c=y, cmap="bwr", edgecolors='k')
plt.xlabel("Taille (cm)")
plt.ylabel("Poids (kg)")
plt.title("Fronti√®re de d√©cision du classificateur")
plt.grid(True)
plt.show()

üëâ Ce classificateur trace une droite qui **s√©pare deux groupes**. Il apprendra √† faire de m√™me dans des cas plus complexes avec les r√©seaux de neurones.

## üß™ Limite du classificateur lin√©aire

## üß™ Exemple 2 : Peut-on deviner si une personne est heureuse selon son niveau de stress et d'excitation ?

On simule ici deux groupes :
- les personnes heureuses : niveau de stress **faible ou √©lev√©**, mais excitation **moyenne**
- les personnes non heureuses : stress **moyen**, mais excitation **faible ou √©lev√©e**

Cela cr√©e un motif **non lin√©aire**, qu‚Äôun classificateur lin√©aire ne peut pas correctement s√©parer.

In [None]:
from sklearn.datasets import make_circles

# Donn√©es en forme de cercles imbriqu√©s
X2, y2 = make_circles(n_samples=200, noise=0.1, factor=0.5, random_state=0)

# Affichage
plt.scatter(X2[:, 0], X2[:, 1], c=y2, cmap='bwr', edgecolors='k')
plt.title("Donn√©es non-lin√©aires (cercles imbriqu√©s)")
plt.xlabel("x1")
plt.ylabel("x2")
plt.grid(True)
plt.axis('equal')
plt.show()

In [None]:
model2 = LogisticRegression()
model2.fit(X2, y2)
print("Score de pr√©cision :", model2.score(X2, y2))

In [None]:
# Visualisation de la pr√©diction
xx, yy = np.meshgrid(np.linspace(-1.5, 1.5, 200), np.linspace(-1.5, 1.5, 200))
grid = np.c_[xx.ravel(), yy.ravel()]
probs = model2.predict_proba(grid)[:, 1].reshape(xx.shape)

plt.contourf(xx, yy, probs, levels=[0, 0.5, 1], cmap="bwr", alpha=0.2)
plt.scatter(X2[:, 0], X2[:, 1], c=y2, cmap="bwr", edgecolors='k')
plt.title("Le classificateur lin√©aire √©choue ici")
plt.xlabel("x1")
plt.ylabel("x2")
plt.grid(True)
plt.axis('equal')
plt.show()

üëâ Ce deuxi√®me exemple montre que la **r√©gression logistique ne peut tracer qu'une droite**.  
Elle √©choue donc √† s√©parer des donn√©es en forme de cercle.

C‚Äôest pour cela que l‚Äôon utilise des **mod√®les plus puissants comme les r√©seaux de neurones** : ils peuvent apprendre √† tracer des **fronti√®res complexes**, non lin√©aires.

## üß† Exercice final : √Ä vous de jouer !

On cherche √† savoir si une personne est **sportive** ou non √† partir de deux informations simples :
- Son **temps moyen de sommeil par nuit** (en heures)
- Le **nombre d'heures de sport par semaine**

Les donn√©es ci-dessous sont issues d'une enqu√™te simplifi√©e aupr√®s de 100 personnes (50 sportives, 50 non sportives).

### üéØ Objectif :
Utilisez le **code vu pr√©c√©demment** pour :
1. Entra√Æner un classificateur lin√©aire
2. Afficher la fronti√®re de s√©paration
3. Mesurer la pr√©cision du mod√®le

*Les donn√©es sont d√©j√† pr√™tes ci-dessous, √† vous de jouer !*

In [None]:
# G√©n√©ration de donn√©es fictives
np.random.seed(3)

# Sportifs : dorment en moyenne 7h, font 6h de sport
sommeil_s = np.random.normal(7, 0.5, 50)
sport_s = np.random.normal(6, 1, 50)

# Non sportifs : dorment 6.5h mais tr√®s peu de sport
sommeil_ns = np.random.normal(6.5, 0.6, 50)
sport_ns = np.random.normal(0.5, 0.4, 50)

X3 = np.vstack((np.column_stack((sommeil_s, sport_s)),
                np.column_stack((sommeil_ns, sport_ns))))
y3 = np.array([1]*50 + [0]*50)  # 1 : sportif, 0 : non sportif

# Visualisation des donn√©es
plt.scatter(X3[:, 0], X3[:, 1], c=y3, cmap='bwr', edgecolors='k')
plt.xlabel("Sommeil (h/nuit)")
plt.ylabel("Heures de sport (h/semaine)")
plt.title("√ätes-vous sportif ?")
plt.grid(True)
plt.show()

---

### üìú Licence d'utilisation

Ce document est prot√©g√© sous licence **Creative Commons BY-NC-ND 4.0 International**  
üîí **Aucune modification ni r√©utilisation sans autorisation explicite de l'auteur.**

- üë§ Auteur : Christie Vassilian  
- üì• T√©l√©chargement autoris√© uniquement √† usage p√©dagogique personnel  
- üö´ R√©utilisation commerciale ou modification interdite  

[![Licence CC BY-NC-ND](https://licensebuttons.net/l/by-nc-nd/4.0/88x31.png)](https://creativecommons.org/licenses/by-nc-nd/4.0/)
