# Séance 4 : Traitement de données avec Python

Nous allons étudier plusieurs structures de données en Python et apprendre à manipuler des fichiers CSV, ainsi qu’à visualiser des données à l’aide de la bibliothèque Matplotlib.

## Plan du cours
1. **Listes et tuples**
2. **Dictionnaires**
3. **Manipulation de données CSV**
4. **Visualisation de données avec Matplotlib**

À la fin, vous trouverez **10 projets mathématiques** à rendre sur GitHub pour mettre en pratique les connaissances acquises.


## 1. Listes et Tuples

Les **listes** et les **tuples** font partie des structures de données les plus fondamentales en Python.

### 1.1 Listes
Une liste est une structure de données **mutable** : on peut en changer la taille et le contenu après sa création.

```python
ma_liste = [10, 20, 30]
print(ma_liste)
ma_liste.append(40)  # Ajouter un élément à la fin
print(ma_liste)
```

**Opérations courantes** :
- `append(x)`: ajoute l'élément `x` à la fin de la liste.
- `insert(i, x)`: insère l'élément `x` à la position `i`.
- `pop(i)`: retire et retourne l'élément à la position `i` (par défaut le dernier si `i` n'est pas fourni).
- `sort()`: trie la liste sur place.

### 1.2 Tuples
Un **tuple** ressemble beaucoup à une liste, mais il est **immuable** : on ne peut ni ajouter ni supprimer d'éléments après sa création.

```python
mon_tuple = (1, 2, 3)
print(mon_tuple)
```

Les tuples sont souvent utilisés pour représenter des données "fixes" ou des groupes de variables qui ne doivent pas changer, comme les coordonnées d'un point `(x, y)`.


In [2]:
# Exemple d'utilisation de listes et tuples
ma_liste = [10, 20, 30]
print("Liste initiale:", ma_liste)

# Ajout d'un élément
ma_liste.append(40)
print("Après append(40):", ma_liste)

# Affichage d'un élément
element_deux = ma_liste[2]
print("L'élément à la position 2 de la liste est:", element_deux)

# Insertion
ma_liste.insert(1, 15)
print("Après insert(1, 15):", ma_liste)

# Suppression de l'élément en position 2
elem = ma_liste.pop(2)
print(f"Élément retiré : {elem}")
print("Liste après pop(2):", ma_liste)

# Tri de la liste
ma_liste.sort()
print("Liste triée:", ma_liste)

# Tuple
coords = (5, 6)
print("Un tuple de coordonnées :", coords)
try:
    coords[0] = 10
except TypeError as e:
    print("Erreur (normal car c'est un tuple immuable) :", e)

Liste initiale: [10, 20, 30]
Après append(40): [10, 20, 30, 40]
L'élément à la position 2 de la liste est: 30
Après insert(1, 15): [10, 15, 20, 30, 40]
Élément retiré : 20
Liste après pop(2): [10, 15, 30, 40]
Liste triée: [10, 15, 30, 40]
Un tuple de coordonnées : (5, 6)
Erreur (normal car c'est un tuple immuable) : 'tuple' object does not support item assignment


### Exercice 1
- Créez une liste `notes` contenant les notes d’un étudiant : `[12, 15, 9, 18]`.
- Affichez la moyenne de ces notes.
- Ajoutez la note `14` à la liste et affichez la nouvelle moyenne.

In [None]:
# Saisissez votre code ici pour Exercice 1.

### Exercice 2
- Créez un tuple `p = (4, 5)` représentant un point.
- Tentez de modifier la première coordonnée (pour constater l'erreur).
- Expliquez dans un commentaire la différence entre liste et tuple.

In [None]:
# Saisissez votre code ici pour Exercice 2.

## 2. Dictionnaires

Les **dictionnaires** en Python permettent de stocker des paires clé-valeur. Ils sont **mutables** et facilitent la recherche d'informations via des clés uniques.

```python
mon_dico = {
    "nom": "Alice",
    "age": 25,
    "ville": "Antananarivo"
}
print(mon_dico["nom"])  # Accès à la valeur associée à la clé "nom"
mon_dico["profession"] = "Étudiante"  # Ajout d'une nouvelle clé
```

**Méthodes utiles** :
- `dico.keys()`: retourne la liste des clés.
- `dico.values()`: retourne la liste des valeurs.
- `dico.items()`: retourne la liste des (clé, valeur) sous forme de tuples.
- `dico.get("clé", valeur_par_défaut)`: obtient la valeur associée à la clé, ou une valeur par défaut si la clé est absente.

Les dictionnaires sont particulièrement adaptés pour représenter des données structurées, par exemple des informations sur un étudiant, un produit, etc.

In [None]:
# Exemple d'utilisation d'un dictionnaire
etudiant = {
    "nom": "Alice",
    "age": 25,
    "ville": "Antananarivo"
}

print("Nom de l'étudiant :", etudiant["nom"])
print("Ville :", etudiant.get("ville", "Inconnue"))

# Ajout d'une nouvelle clé/valeur
etudiant["notes"] = [12, 15, 14]
print("Dictionnaire mis à jour :", etudiant)

# Parcours d'un dictionnaire
for cle, valeur in etudiant.items():
    print(cle, "->", valeur)

### Exercice 3
- Créez un dictionnaire `contact` avec les clés : `"nom"`, `"telephone"`, `"email"`.
- Affichez chacune de ces informations.
- Ajoutez une clé `"adresse"` au dictionnaire.

In [None]:
# Saisissez votre code ici pour Exercice 3.

### Exercice 4
- Créez un dictionnaire `stock` pour un magasin (ex : `{ "pommes": 50, "bananes": 20 }`).
- Écrivez un code qui demande à l'utilisateur un produit, puis qui affiche la quantité disponible ou un message si le produit n'existe pas dans le dictionnaire.

In [None]:
# Saisissez votre code ici pour Exercice 4.

## 3. Les données dans un CSV

Les fichiers CSV (Comma-Separated Values) sont très utilisés pour stocker et échanger des données tabulaires (simples). Python propose plusieurs méthodes pour lire et écrire dans des fichiers CSV.

### 3.1 Lecture d'un CSV
Avec le module `csv` :
```python
import csv

with open('donnees.csv', 'r', newline='', encoding='utf-8') as f:
    lecteur = csv.reader(f)
    for ligne in lecteur:
        print(ligne)
```

### 3.2 Écriture dans un CSV
```python
import csv

with open('resultats.csv', 'w', newline='', encoding='utf-8') as f:
    ecrivain = csv.writer(f)
    ecrivain.writerow(['Nom', 'Score'])
    ecrivain.writerow(['Alice', 85])
    ecrivain.writerow(['Bob', 92])
```

Vous pouvez également utiliser un `DictReader` ou `DictWriter` pour manipuler directement chaque ligne sous forme de dictionnaire, ce qui est parfois plus pratique.


In [None]:
# Exemple simple de lecture/écriture CSV dans un code exécuté localement
import csv

# Ecriture
with open('exemple.csv', 'w', newline='', encoding='utf-8') as f:
    writer = csv.writer(f)
    writer.writerow(["Nom", "Age"])
    writer.writerow(["Alice", 25])
    writer.writerow(["Bob", 30])

# Lecture
with open('exemple.csv', 'r', newline='', encoding='utf-8') as f:
    reader = csv.reader(f)
    for row in reader:
        print(row)

### Exercice 5
- Créez un fichier CSV nommé `produits.csv` contenant le nom d'un produit et son prix.
- Écrivez un script Python qui lit ce fichier et affiche les produits avec leur prix.
- Calculez la somme totale des prix.

In [None]:
# Saisissez votre code ici pour Exercice 5.

### Exercice 6
- Créez un fichier CSV `etudiants.csv` avec les colonnes `Nom`, `Age`, `Note`.
- Écrivez un code qui lit ce fichier et calcule la moyenne des notes.
- Affichez les étudiants qui ont la note la plus élevée.

In [None]:
# Saisissez votre code ici pour Exercice 6.

## 4. Visualisation de données avec Matplotlib

[Matplotlib](https://matplotlib.org/) est l’une des bibliothèques de référence pour la visualisation de données en Python, permettant de tracer des graphiques en 2D (et basiquement en 3D).

### 4.1 Installation
- Généralement installée par défaut dans la plupart des distributions Python.
- Sinon : `pip install matplotlib`

### 4.2 Exemple de tracé simple
```python
import matplotlib.pyplot as plt

x = [1, 2, 3, 4]
y = [2, 4, 1, 8]

plt.plot(x, y)
plt.title("Exemple simple")
plt.xlabel("Axe X")
plt.ylabel("Axe Y")
plt.show()
```

### 4.3 Diagramme en barres
```python
import matplotlib.pyplot as plt

fruits = ['Pomme', 'Banane', 'Orange']
quantites = [10, 15, 8]

plt.bar(fruits, quantites)
plt.title("Quantité de fruits")
plt.show()
```

Matplotlib propose beaucoup d’autres types de graphiques (histogrammes, nuages de points, camemberts, etc.), ainsi que des personnalisations avancées.


In [None]:
# Exemple complet avec Matplotlib
import matplotlib.pyplot as plt

x = [i for i in range(11)]  # 0 à 10
y = [i**2 for i in x]      # y = x^2

plt.plot(x, y)
plt.title("Représentation de y = x^2")
plt.xlabel("x")
plt.ylabel("x^2")
plt.show()

### Exercice 7
- Générez des points pour la fonction `f(x) = 2x + 1` (sur un intervalle de 0 à 10).
- Tracez la courbe correspondante.
- Ajoutez un titre et des légendes d’axes.

In [None]:
# Saisissez votre code ici pour Exercice 7.

### Exercice 8
- À partir d’une liste de notes `[12, 14, 9, 16, 18, 10, 14, 15]`, réalisez un histogramme (ou diagramme en barres) montrant la distribution de ces notes.
- Personnalisez les couleurs ou le style.

In [None]:
# Saisissez votre code ici pour Exercice 8.

## Introduction à Pandas

[Pandas](https://pandas.pydata.org/) est une bibliothèque Python très utilisée pour l’analyse et la manipulation de données.

### Installation
- Pour l’installer : `pip install pandas`

### Les DataFrames
La structure de base de Pandas est le **DataFrame**, un tableau étiqueté (avec des noms de colonnes et des index pour les lignes) qui facilite l’analyse et la transformation de données.

Exemple d’utilisation :
```python
import pandas as pd

data = {
    'Nom': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 22],
    'Note': [15.5, 17.0, 10.5]
}
df = pd.DataFrame(data)
print(df)
#   Nom      Age    Note
# 0  Alice     25   15.5
# 1    Bob     30   17.0
# 2 Charlie    22   10.5

# Lecture depuis un CSV
# df_csv = pd.read_csv('fichier.csv')
# print(df_csv.head())
```

Avec Pandas, vous pouvez facilement filtrer, trier, grouper des données, effectuer des opérations statistiques, etc.

### Exercice 9
- Créez un DataFrame à partir d’un dictionnaire qui contient au moins 3 colonnes.
- Affichez le résumé statistique (moyenne, écart-type...) en utilisant `df.describe()`.
- Filtrez les lignes selon une condition (par exemple, `Age > 25`).

In [None]:
# Saisissez votre code ici pour Exercice 9.

### Exercice 10
- Créez deux DataFrames ayant une colonne en commun (par ex. `ID`) mais des informations différentes.
- Fusionnez-les (avec `pd.merge`) pour combiner leurs données.
- Affichez le résultat final.

In [None]:
# Saisissez votre code ici pour Exercice 10.

### Exercice 11
- Créez un DataFrame contenant des valeurs manquantes (NaN).
- Identifiez les lignes manquantes.
- Supprimez ou remplacez ces valeurs (par exemple, par la moyenne d’une colonne).
- Affichez le DataFrame avant et après le nettoyage.

In [None]:
# Saisissez votre code ici pour Exercice 11.

# 10 Projets Mathématiques à Rendre sur GitHub

1. **Analyse de polynômes** :
   - Écrivez un programme qui prend un polynôme (ex: `2x^2 + 3x - 5`) et propose :
     - Son tracé avec Matplotlib.
     - Ses racines (discriminant, éventuellement méthode numérique si nécessaire).

2. **Statistiques sur un ensemble de données** :
   - Récupérez un fichier CSV contenant des données (par exemple, poids et taille d'un échantillon de personnes).
   - Calculez la moyenne, la variance et la médiane.
   - Affichez graphiquement la distribution.

3. **Étude d'une suite numérique** :
   - Implémentez une suite récursive (ex: suite de Fibonacci, suite logistique, etc.).
   - Affichez les 20 premiers termes.
   - Proposez une visualisation et analysez le comportement asymptotique.

4. **Approximation de Pi** :
   - Utilisez la méthode de Monte Carlo pour approximer π.
   - Générez des points aléatoires dans un carré et comptez ceux qui tombent dans le cercle inscrit.
   - Tracez le résultat pour montrer l’évolution de l’estimation.

5. **Système linéaire** :
   - Codez la résolution d’un système linéaire (matrices) à partir d’un fichier CSV décrivant la matrice et le vecteur de second membre.
   - Comparez les solutions obtenues via différentes méthodes (Gauss, numpy.linalg, etc.).

6. **Interpolation polynomiale** :
   - Donnez quelques points (x, y) dans un CSV.
   - Trouvez le polynôme d’interpolation.
   - Affichez à la fois les points et la courbe du polynôme interpolé.

7. **Étude d'une fonction exponentielle** :
   - Définissez une fonction `f(x) = a * e^{bx}`.
   - Utilisez Matplotlib pour tracer la courbe, puis un script pour calculer des approximations.
   - Analysez la croissance pour différentes valeurs de `a` et `b`.

8. **Calcul d’intégrales (méthode numérique)** :
   - Implémentez la méthode des trapèzes ou de Simpson pour calculer l'intégrale d'une fonction donnée.
   - Comparez le résultat avec la valeur "exacte" (si connue) et tracez l’évolution de l’erreur en fonction du pas.

9. **Visualisation de probabilités** :
   - Simulez des lancers de dés ou des tirages aléatoires.
   - Affichez la distribution de probabilités sous forme d’histogramme.
   - Comparez avec la distribution théorique.

10. **Transformée de Fourier discrète** :
   - Implémentez une fonction qui calcule la transformée de Fourier discrète d’une liste de données.
   - Testez avec une fonction sinusoïdale et affichez le spectre.

Vous devez :
- Placer le code (et éventuellement vos données CSV) dans un dépôt GitHub.
- Inclure un `README.md` expliquant votre projet et comment l’exécuter.
- Faire un usage approprié des structures de données (listes, tuples, dictionnaires) et proposer des visualisations pertinentes avec Matplotlib.


## Références bibliographiques

- [Documentation officielle de Python](https://docs.python.org/3/)
- [MIT OpenCourseWare - Python](https://ocw.mit.edu/courses/search/?q=python)
- [Matplotlib Documentation](https://matplotlib.org/)
- [Pandas Documentation](https://pandas.pydata.org/)
- **Wes McKinney**, *Python for Data Analysis*, O’Reilly, 2017.
- **Jake VanderPlas**, *Python Data Science Handbook*, O’Reilly, 2016.
- **Allen B. Downey**, *Think Python*, O’Reilly, 2e éd., 2015.

