# 🎨 Visualisation avec Matplotlib et Seaborn

Jour 4 — Semaine 2

Aujourd'hui, nous allons apprendre à visualiser des données à l'aide des bibliothèques `matplotlib` et `seaborn`.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(style='whitegrid')
%matplotlib inline

In [None]:
# Dataset exemple : Titanic
url = 'https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv'
df = pd.read_csv(url)
df.head()

## 🧾 Aperçu complet de la DataFrame

In [None]:
pd.set_option('display.max_rows', None)
display(df)

In [None]:
df.describe(include='all')

## 📊 Histogramme d'une variable numérique

In [None]:
plt.figure(figsize=(8, 5))
sns.histplot(df['Age'].dropna(), kde=True, bins=30)
plt.title('Distribution des âges')
plt.xlabel('Âge')
plt.ylabel('Fréquence')
plt.show()

## 📦 Boxplot par sexe

In [None]:
plt.figure(figsize=(8, 5))
sns.boxplot(x='Sex', y='Age', data=df)
plt.title("Répartition de l'âge par sexe")
plt.show()

## ☁️ Nuage de points entre Age et Fare

In [None]:
plt.figure(figsize=(8, 5))
sns.scatterplot(x='Age', y='Fare', hue='Sex', data=df)
plt.title('Lien entre âge et tarif payé')
plt.show()

## 🔥 Heatmap de corrélation

In [None]:
plt.figure(figsize=(10, 6))
corr = df.corr(numeric_only=True)
sns.heatmap(corr, annot=True, cmap='coolwarm')
plt.title('Matrice de corrélation')
plt.show()

## 🧠 Exercices

1. Affichez un histogramme pour la variable `Fare`.
2. Créez un boxplot de `Fare` par `Pclass`.
3. Faites une heatmap uniquement sur `Age`, `Fare`, et `Pclass`.