# Module 28: Introduction to Pandas
## Module 28 : Introduction à Pandas

## 1. Why This Matters / 1. Pourquoi c'est important
- **English:** Pandas allows you to handle and analyze tabular data easily, with powerful tools for selection and summary.
- **Français :** Pandas vous permet de gérer et analyser des données tabulaires facilement, avec des outils puissants pour la sélection et le résumé.

## 2. Spaced & Interleaved Review / 2. Révision espacée et mélangée
- **Flash-back:** How did we read CSV files before? / Comment lisions-nous les fichiers CSV précédemment ?
- **Interleaving:** How could you filter data after loading? / Comment filtreriez-vous les données après chargement ?

## 3. Quick Quiz / 3. Quiz rapide
1. True or False: A Pandas Series is like a column in a table. / Vrai ou Faux : une Series est comme une colonne dans un tableau.
2. Which object holds 2D data with rows and columns? / Quel objet contient des données 2D avec lignes et colonnes ?
3. How do you select the 'Age' column from DataFrame df? / Comment sélectionner la colonne 'Age' du DataFrame df ?
4. What method gives basic stats like mean and count? / Quelle méthode donne des statistiques de base comme moyenne et compte ?

## 4. Learning Objectives / 4. Objectifs d'apprentissage
By the end, you can: / À la fin, vous pourrez :
- Create Series and DataFrame objects. / Créer des Series et DataFrame.
- Select data by label and position. / Sélectionner des données par étiquette et position.
- Filter rows with conditions. / Filtrer les lignes avec des conditions.
- Use `describe()` for summary statistics. / Utiliser `describe()` pour les statistiques.

## 5. Core Content / 5. Contenu principal
- **Series creation / création de Series :**
```python
import pandas as pd
s = pd.Series([10, 20, 30], index=['a', 'b', 'c'])
print(s)
```  
- **DataFrame creation / création de DataFrame :**
```python
df = pd.DataFrame({
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'Score': [85.5, 92.0, 88.0]
})
print(df)
```  
- **Selection / sélection :**
```python
print(df['Age'])           # column by label
print(df.loc[0])          # row by label (index)
print(df.iloc[1, 2])      # by integer position
```  
- **Filtering / filtrage :**
```python
print(df[df['Score'] > 90])  # rows where Score > 90
```  
- **Summary / résumé :**
```python
print(df.describe())
```

## 6. Starter Code (Incomplete) / 6. Code de démarrage (incomplet)
Complete the TODOs to create and explore a DataFrame. / Complétez les TODO pour créer et explorer un DataFrame.

In [None]:
# pandas_starter.py
import pandas as pd

# TODO: create a Series of temperatures [22, 21, 23] with labels ['Jan', 'Feb', 'Mar']
temps = None

# TODO: create a DataFrame 'data' with columns 'City' and 'Population'
data = None

print(temps)
print(data.head())

# TODO: filter 'data' for Population > 1000000


## 7. Hands-On Project: Sales Data Analysis / 7. Projet pratique : Analyse des ventes
- **Description:**
  1. Load 'sales.csv' into a DataFrame (columns: Date, Product, Amount).
  2. Select sales for 'Product A'.
  3. Calculate total and average Amount.
  4. Display results.
- **Rubric / Barème :**
- Data loading and parsing: 30% / Chargement et parsing : 30%
- Selection and filtering: 30% / Sélection et filtrage : 30%
- Summary statistics: 30% / Statistiques de résumé : 30%
- Code clarity & comments: 10% / Clarté du code et commentaires : 10%

## 8. Stretch Tasks / 8. Tâches supplémentaires
- Add a new column with 10% tax on Amount. / Ajoutez une colonne avec 10% de taxe sur Amount.
- Group by Product and calculate totals. / Groupez par produit et calculez les totaux.
- Plot a bar chart of total sales by product. / Tracez un graphique à barres des ventes totales par produit.

## 9. Reflection / 9. Réflexion
- **Summary:** How does Pandas simplify data tasks? / Comment Pandas simplifie-t-il les tâches de données ?
- **Muddiest point:** Any confusion with loc vs iloc? / Des doutes sur loc vs iloc ?

## 10. Resources / 10. Ressources
- https://pandas.pydata.org/docs/
- https://pandas.pydata.org/docs/reference/series.html
- https://pandas.pydata.org/docs/reference/frame.html
- https://realpython.com/pandas-python-explore-dataset/