# Exercice : Analyse des données du Titanic avec Pandas
## Objectif
L'objectif de cet exercice est d'explorer et d'analyser les données des passagers du Titanic en utilisant la bibliothèque **Pandas**.
Nous allons manipuler un **DataFrame**, effectuer des transformations et analyser les tendances des données.

## Étapes
1. Charger les données du Titanic.
2. Analyser la structure des données.
3. Réaliser des statistiques descriptives.
4. Filtrer et manipuler certaines colonnes.
5. Répondre à des questions basées sur les données.


In [None]:
# Importation des bibliothèques nécessaires
import pandas as pd

# Chargement des données (fichier Titanic en Pandas)
df = pd.read_csv('titanic.csv')  # Modifier avec le bon chemin si nécessaire

# Affichage des premières lignes du dataset
df.head()

## 1. Analyse des données
Affichons quelques statistiques sur le dataset.

In [None]:
# Affichage des informations générales sur le DataFrame
df.info()

# Affichage des statistiques descriptives
df.describe()

## 2. Nettoyage des données
- Vérifions s'il y a des valeurs manquantes
- Remplaçons les valeurs manquantes dans la colonne `Age` par la médiane.

In [None]:
# Vérification des valeurs manquantes
df.isnull().sum()

# Remplacement des âges manquants par la médiane
df['Age'].fillna(df['Age'].median(), inplace=True)

## 3. Analyse des passagers
- Quel est le nombre total de passagers ?
- Combien de passagers ont survécu ?
- Quel est le pourcentage de survivants par sexe ?

In [None]:
# Nombre total de passagers
total_passagers = len(df)
print(f'Nombre total de passagers : {total_passagers}')

# Nombre de survivants
total_survivants = df['Survived'].sum()
print(f'Nombre de survivants : {total_survivants}')

# Pourcentage de survivants par sexe
df.groupby('Sex')['Survived'].mean() * 100

## 4. Analyse des classes
- Quel est le taux de survie par classe ?
- Y a-t-il une différence de survie entre les différentes classes de passagers ?

In [None]:
# Taux de survie par classe
df.groupby('Pclass')['Survived'].mean() * 100

## 5. Exploration des âges
- Quelle est la répartition des âges des passagers ?
- Les enfants (moins de 18 ans) ont-ils eu un meilleur taux de survie ?

In [None]:
# Distribution des âges
df['Age'].hist(bins=20)

In [None]:
# Comparaison du taux de survie entre enfants et adultes
df['IsChild'] = df['Age'] < 18
df.groupby('IsChild')['Survived'].mean() * 100

### Fin de l'exercice 🎯
Nous avons effectué une première analyse des données du Titanic avec Pandas !

**Questions de réflexion :**
- Quels autres facteurs pourraient influencer la survie ?
- Comment pourrait-on aller plus loin dans l'analyse ?