# Démonstration : Lecture et écriture de fichiers avec NumPy et Pandas

Objectifs :
1. Lire et écrire des fichiers avec NumPy et Pandas
2. Détecter et gérer les valeurs manquantes
3. Sélectionner et manipuler des données
4. Parcourir un DataFrame ligne par ligne

In [None]:
# Import des bibliothèques
import numpy as np
import pandas as pd

## NumPy : Lecture et écriture de fichiers

In [None]:
# Création d'un fichier texte simple pour l'exemple
np.savetxt("mesures.txt", np.array([[20.1, 21.3, 19.8, 22.0],
                                    [21.0, 22.2, 20.5, 23.1]]))

# Lecture du fichier
donnees = np.loadtxt("mesures.txt")
print("Données lues avec np.loadtxt :\n", donnees)  # \n = saut de ligne
print("Type :", type(donnees))

In [None]:
# Lecture d'un CSV avec NumPy
np.savetxt("mesures.csv", donnees, delimiter=",")
donnees_csv = np.loadtxt("mesures.csv", delimiter=",")
print("\nLecture CSV :\n", donnees_csv)

In [None]:
# Lecture robuste avec np.genfromtxt (valeurs manquantes)
with open("temperatures.csv", "w") as f:
    f.write("timestamp,temperature\n")
    f.write("2021-01-01 00:00:00,20.1\n")
    f.write("2021-01-01 01:00:00,21.3\n")
    f.write("2021-01-01 02:00:00,\n")

temperatures = np.genfromtxt("temperatures.csv", delimiter=",", skip_header=1, usecols=1)
print("Températures lues :", temperatures)

# Remplacement des NaN par la moyenne
mean_temp = np.nanmean(temperatures)
temperatures = np.where(np.isnan(temperatures), mean_temp, temperatures)
print("Températures corrigées :", temperatures)

# Sauvegarde
np.savetxt("temperatures_corrigees.csv", temperatures, delimiter=",", fmt="%.2f")

## Pandas : Lecture et écriture de fichiers

In [None]:
# Création d'un DataFrame
df = pd.DataFrame({
    "Nom": ["Alice", "Bob", "Charlie"],
    "Âge": [20, 22, 19],
    "Poids": [55, 70, 65]
})
df

In [None]:
# Écriture dans un fichier CSV et TXT
df.to_csv("data_export.csv", index=False)
df.to_csv("data_export.txt", sep="\t", index=False)

### 2.1 Exploration rapide des données

In [None]:
print(df.head())
print(df.describe())
print(df.info())

## Gestion des valeurs manquantes

In [None]:
df_nan = pd.DataFrame({
    'temp': [0, 10, 20, 30],
    'solubilite': [32.0, 34.1, None, 37.5]
})

# Détection
print(df_nan.isna())
print(df_nan.isna().sum())
print(df_nan.isna().sum().sum())

# Remplacement par la moyenne
df_nan['solubilite'] = df_nan['solubilite'].fillna(df_nan['solubilite'].mean())
df_nan

## Sélection et manipulation

In [None]:
poissons = pd.DataFrame({
    "Espèce": ["Truite", "Saumon", "Perchaude", "Brochet"],
    "Longueur_cm": [35, 52, 27, 61],
    "Masse_g": [450, 1500, 320, 2200]
})

# Sélection avec iloc
print(poissons.iloc[1])      # 2e ligne
print(poissons.iloc[:, 0])   # 1ère colonne
print(poissons.iloc[0:2,0:2])# sous-tableau

In [None]:
# Conversion en NumPy
t = poissons["Longueur_cm"].to_numpy()
m = poissons["Masse_g"].to_numpy()
print("Tableau NumPy Longueur :", t)
print("Tableau NumPy Masse :", m)

In [None]:
# Parcourir les lignes avec iterrows
for index, ligne in poissons.iterrows():
    if ligne["Masse_g"] > 1000:
        print(f"{ligne['Espèce']} : grosse masse")
    else:
        print(f"{ligne['Espèce']} : masse normale")

## Exercices rapides
1. Lire un CSV avec des valeurs manquantes et afficher le nombre de NaN.
2. Remplacer les NaN par la moyenne d’une colonne.
3. Extraire la 2ᵉ colonne avec `iloc` et convertir en tableau NumPy.
4. Parcourir le DataFrame ligne par ligne avec `.iterrows()` et afficher un message selon une condition.
5. Sauvegarder le DataFrame modifié dans un nouveau fichier CSV.