# Exercice : Visualisation des données Iris avec Matplotlib
Cet exercice a pour but d'explorer les données Iris à l'aide de la bibliothèque Matplotlib.
Nous allons créer plusieurs types de graphiques pour mieux comprendre la distribution des caractéristiques des fleurs.

### Objectifs :
- Charger et explorer l'ensemble de données Iris.
- Générer des visualisations adaptées : histogrammes, nuages de points, diagrammes en barres et en secteurs.
- Personnaliser les graphiques (titres, légendes, couleurs, annotations).


In [None]:
# Importation des bibliothèques
import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets
from matplotlib.colors import ListedColormap

# Chargement des données Iris
iris = datasets.load_iris()
data = iris['data']
targets = iris['target']
features = iris['feature_names']
target_names = iris['target_names']

# Affichage des 5 premières lignes
print("Aperçu des données :")
for i in range(5):
    print(data[i], '->', target_names[targets[i]])

## 1. Histogrammes
Nous allons tracer des histogrammes pour visualiser la distribution des caractéristiques des fleurs.

In [None]:
# Création d'un histogramme pour la longueur des pétales
plt.figure(figsize=(8, 5))
plt.hist(data[:, 2], bins=20, color='skyblue', edgecolor='black', alpha=0.7)
plt.xlabel(features[2])
plt.ylabel('Fréquence')
plt.title('Distribution de la longueur des pétales')
plt.show()

## 2. Nuage de points (Scatter Plot)
Nous allons visualiser la relation entre la longueur et la largeur des pétales en fonction des espèces.

In [None]:
# Création d'un scatter plot
cmap = ListedColormap(['red', 'green', 'blue'])
plt.figure(figsize=(8, 5))
scatter = plt.scatter(data[:, 2], data[:, 3], c=targets, cmap=cmap, alpha=0.7)
plt.xlabel(features[2])
plt.ylabel(features[3])
plt.title('Nuage de points : Longueur vs Largeur des pétales')
plt.colorbar(scatter, ticks=[0, 1, 2], label='Espèces')
plt.show()

## 3. Diagramme en barres
Nous allons afficher la moyenne de la longueur des sépales par espèce.

In [None]:
# Calcul des moyennes de la longueur des sépales par espèce
sepal_lengths = [np.mean(data[targets == i, 0]) for i in range(3)]

# Affichage du diagramme en barres
plt.figure(figsize=(8, 5))
plt.bar(target_names, sepal_lengths, color=['red', 'green', 'blue'])
plt.xlabel('Espèce')
plt.ylabel(features[0])
plt.title('Moyenne de la longueur des sépales par espèce')
plt.show()

## 4. Diagramme en secteurs (Camembert)
Nous allons afficher la répartition des espèces dans le dataset.

In [None]:
# Comptage du nombre d'échantillons par espèce
species_counts = [np.sum(targets == i) for i in range(3)]

# Affichage du diagramme en camembert
plt.figure(figsize=(8, 5))
plt.pie(species_counts, labels=target_names, autopct='%1.1f%%', colors=['red', 'green', 'blue'])
plt.title('Répartition des espèces dans le dataset')
plt.show()

## Conclusion
Nous avons exploré les données Iris à l'aide de plusieurs visualisations.
Vous pouvez essayer d'ajouter d'autres visualisations comme des boîtes à moustaches ou des courbes de densité !