In [1]:
import pandas as pd

In [8]:
def clean_country_data(file_path="countries.csv"):
    """
    Charger, nettoyer et enregistrer les données nettoyées à partir du fichier CSV donné.
    
    Étapes :
    - Supprimer les doublons
    - Gérer les valeurs manquantes
    - Convertir les colonnes numériques aux types de données appropriés
    """
    try:
        # Charger les données
        df = pd.read_csv(file_path)
        print("Données chargées avec succès.")

        # Supprimer les doublons
        df.drop_duplicates(inplace=True)

        # Gérer les valeurs manquantes
        df.dropna(subset=['Pays', 'Indice de qualité de vie'], inplace=True)  # Supprimer les lignes avec pays ou indice de qualité de vie manquants

        # Convertir 'Indice de qualité de vie' et les autres indices numériques en types numériques
        numeric_columns = [
            'Indice de qualité de vie', 'Indice de pouvoir d\'achat', 'Indice de sécurité',
            'Indice de santé', 'indice du coût de la vie', 'Rapport prix de l\'immobilier / revenu',
            'Indice temps de trajet', 'Indice de pollution', 'Indice climatique'
        ]
        
        for column in numeric_columns:
            df[column] = pd.to_numeric(df[column], errors='coerce')

        # Supprimer les lignes où les indices numériques n'ont pas pu être convertis
        df.dropna(subset=numeric_columns, inplace=True)

        # Enregistrer les données nettoyées
        cleaned_file = "cleaned_countries.csv"
        df.to_csv(cleaned_file, index=False)
        print(f"Données nettoyées enregistrées dans {cleaned_file}")

        return df

    except Exception as e:
        print(f"Erreur lors du nettoyage des données : {e}")

In [9]:
clean_country_data()

Données chargées avec succès.
Données nettoyées enregistrées dans cleaned_countries.csv


Unnamed: 0,Pays,Indice de qualité de vie,Indice de pouvoir d'achat,Indice de sécurité,Indice de santé,indice du coût de la vie,Rapport prix de l'immobilier / revenu,Indice temps de trajet,Indice de pollution,Indice climatique
0,Luxembourg,220.1,184.3,65.8,75.2,64.8,8.6,27.0,23.3,82.6
1,Netherlands,211.3,134.5,73.1,79.3,60.5,7.7,23.5,21.6,87.2
2,Denmark,209.9,137.3,74.0,78.4,66.9,6.5,27.8,20.6,82.5
3,Oman,208.9,153.8,81.7,65.1,39.8,3.1,22.1,35.6,67.2
4,Switzerland,205.0,164.8,73.5,71.5,98.4,11.0,33.0,23.1,79.2
...,...,...,...,...,...,...,...,...,...,...
83,Egypt,85.3,21.4,52.7,47.3,19.0,18.2,48.0,82.7,92.0
84,Sri Lanka,81.1,18.5,57.9,71.4,33.5,34.2,54.5,57.9,59.1
85,Venezuela,79.7,16.0,19.3,38.7,35.9,15.1,32.8,75.1,99.9
86,Bangladesh,73.9,35.9,38.4,42.2,20.9,12.8,57.1,85.4,71.3
