In [3]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import os

"""
Ce script permet de:
1. Demander à l'utilisateur de fournir un fichier CSV.
2. Afficher les premières lignes du fichier pour donner un aperçu des données.
3. Demander à l'utilisateur de choisir entre nettoyer par colonne, valeur ou ligne.
4. Nettoyer les données en fonction du choix de l'utilisateur et enregistrer une copie nettoyée du fichier.
5. Visualiser les données nettoyées sous forme de graphique.
"""
def main():
    # 1. Demander à l'utilisateur de fournir son fichier de données au format CSV
    file_path = input("Veuillez entrer le chemin du fichier CSV: ")
    
    # Vérifier si le fichier existe
    if not os.path.isfile(file_path):
        print("Le fichier n'existe pas. Veuillez vérifier le chemin et réessayer.")
        return
    
    # Lire le fichier CSV
    data = pd.read_csv(file_path)
    
    # 2. Visualiser les données à l'écran sous forme de tableau
    print("Voici un aperçu des données:")
    print(data.head())
    
    # 3. Demander à l'utilisateur d'entrer soit le nom de colonnes, soit la valeur d'une donnée, soit le numéro d'une ligne à nettoyer
    choice = input("Voulez-vous nettoyer par colonne (c), valeur (v) ou ligne (l)? ")
    
    if choice == 'c':
        column_name = input("Veuillez entrer le nom de la colonne à nettoyer: ")
        if column_name in data.columns:
            data[column_name] = data[column_name].fillna('Valeur manquante')
        else:
            print("La colonne n'existe pas.")
    elif choice == 'v':
        value = input("Veuillez entrer la valeur à nettoyer: ")
        data = data.replace(value, 'Valeur nettoyée')
    elif choice == 'l':
        row_number = int(input("Veuillez entrer le numéro de la ligne à nettoyer: "))
        if row_number < len(data):
            data.iloc[row_number] = data.iloc[row_number].fillna('Valeur manquante')
        else:
            print("Le numéro de ligne est hors limites.")
    else:
        print("Choix invalide.")
        return
    
    # 4. Nettoyer les données en fonction du choix de l'utilisateur, en faisant une copie du fichier original
    cleaned_file_path = file_path.replace('.csv', '_cleaned.csv')
    data.to_csv(cleaned_file_path, index=False)
    print(f"Les données nettoyées ont été enregistrées dans {cleaned_file_path}")
    
    # 5. Visualiser les données choisies (colonnes, lignes) sous forme de graphique
    if choice == 'c':
        sns.countplot(x=column_name, data=data)
    elif choice == 'v':
        sns.countplot(x=data.columns[0], data=data)
    elif choice == 'l':
        sns.heatmap(data.iloc[[row_number]].isnull(), cbar=False, cmap='viridis')
    
    plt.show()

if __name__ == "__main__":
    main()

ModuleNotFoundError: No module named 'pandas'