# Module 29: Advanced Pandas
## Module 29 : Pandas avancé

## 1. Why This Matters / 1. Pourquoi c'est important
- **English:** Advanced features like group operations, pivot tables, and joins let you summarize and combine data easily.
- **Français :** Les fonctionnalités avancées comme groupby, tableaux croisés et jointures facilitent le résumé et la combinaison des données.

## 2. Spaced & Interleaved Review / 2. Révision espacée et mélangée
- **Flash-back:** How do you filter rows in a DataFrame? / Comment filtre-t-on des lignes dans un DataFrame ?
- **Interleaving:** How might you merge two DataFrames on a key? / Comment fusionner deux DataFrames sur une clé ?

## 3. Quick Quiz / 3. Quiz rapide
1. True or False: `df.groupby('col')` returns a DataFrame. / Vrai ou Faux : `df.groupby('col')` renvoie un DataFrame.
2. What method gives the mean of groups? / Quelle méthode donne la moyenne des groupes ?
3. How do you pivot a table with index, columns, and values? / Comment pivoter un tableau avec index, colonnes et valeurs ?
4. Which method fills missing values? / Quelle méthode remplit les valeurs manquantes ?

## 4. Learning Objectives / 4. Objectifs d'apprentissage
By the end, you can: / À la fin, vous pourrez :
- Use `groupby` to aggregate data. / Utiliser `groupby` pour agréger les données.
- Create pivot tables with `pivot_table`. / Créer des tableaux croisés dynamiques avec `pivot_table`.
- Merge/join DataFrames on keys. / Fusionner/jointer des DataFrames sur des clés.
- Handle missing data with `dropna` and `fillna`. / Gérer les valeurs manquantes avec `dropna` et `fillna`.

## 5. Core Content / 5. Contenu principal
- **GroupBy / Regroupement :**
```python
import pandas as pd
df = pd.DataFrame({'Category': ['A', 'A', 'B'], 'Value': [10, 20, 30]})
grouped = df.groupby('Category').sum()
print(grouped)
```  
- **Pivot Table / Tableau croisé :**
```python
df = pd.DataFrame({'Date': ['2025-01','2025-01','2025-02'], 'Product': ['X','Y','X'], 'Sales': [100,150,200]})
pivot = df.pivot_table(index='Date', columns='Product', values='Sales', aggfunc='sum')
print(pivot)
```  
- **Merge/Join / Fusion :**
```python
df1 = pd.DataFrame({'ID': [1,2], 'Name': ['Alice','Bob']})
df2 = pd.DataFrame({'ID': [1,2], 'Score': [85,90]})
merged = pd.merge(df1, df2, on='ID')
print(merged)
```  
- **Missing Data / Données manquantes :**
```python
df = pd.DataFrame({'A': [1, None, 3], 'B': [4,5,None]})
dropped = df.dropna()       # remove rows with NaN
filled = df.fillna(0)       # replace NaN with 0
print(dropped, filled)
```

## 6. Starter Code (Incomplete) / 6. Code de démarrage (incomplet)
Complete the TODOs to use advanced Pandas methods. / Complétez les TODO pour utiliser les méthodes avancées de Pandas.

In [None]:
# advanced_pandas_starter.py
import pandas as pd

data = pd.DataFrame({
    'Group': ['X','X','Y','Y'],
    'Value': [5,10,15,20],
    'Date': ['2025-01','2025-01','2025-02','2025-02']
})

# TODO: group by 'Group' and calculate mean of 'Value'
group_mean = None

# TODO: pivot the table with index='Date', columns='Group', values='Value'
pivot_table = None

# TODO: create a new DataFrame with some missing values and fill them with -1
df_missing = pd.DataFrame({'A':[1,None], 'B':[None,2]})
df_filled = None

print(group_mean)
print(pivot_table)
print(df_filled)


## 7. Hands-On Project: Sales Summary by Region / 7. Projet pratique : Résumé des ventes par région
- **Description:**
  1. Load 'sales_data.csv' with columns: Region, Product, Amount.
  2. Group by Region and sum Amount.
  3. Pivot table: index=Region, columns=Product, values=Amount.
  4. Handle any missing sales values by filling with 0.
- **Rubric / Barème :**
- GroupBy aggregation: 30% / Agrégation GroupBy : 30%
- Pivot table creation: 30% / Création du tableau croisé : 30%
- Missing data handling: 20% / Gestion des données manquantes : 20%
- Code clarity & comments: 20% / Clarté du code et commentaires : 20%

## 8. Stretch Tasks / 8. Tâches supplémentaires
- Add a multi-index groupby (Group and Date). / Ajoutez un regroupement multi-index (Group et Date).
- Calculate multiple aggregations (sum, mean). / Calculez plusieurs agrégations (somme, moyenne).
- Merge results with another DataFrame of targets. / Fusionnez les résultats avec un autre DataFrame de cibles.

## 9. Reflection / 9. Réflexion
- **Summary:** How do advanced methods speed up data analysis? / Comment les méthodes avancées accélèrent-elles l'analyse ?
- **Muddiest point:** Any confusion with pivot_table parameters? / Des doutes sur les paramètres de pivot_table ?

## 10. Resources / 10. Ressources
- https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.groupby.html
- https://pandas.pydata.org/docs/reference/api/pandas.pivot_table.html
- https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.merge.html
- https://pandas.pydata.org/docs/user_guide/missing_data.html