In [2]:
import pandas as pd
import os

# Dossier contenant les fichiers CSV
directory = 'data/'

# Liste des années à vérifier
years = list(range(2005, 2023))

# Dictionnaire pour stocker les informations sur les colonnes de chaque fichier
files_info = {}

# Liste pour stocker les noms communs de colonnes
common_columns = None

for year in years:
    file_path = os.path.join(directory, f'vehicules_{year}.csv')
    separators = [',', ';', '\t']
    for sep in separators:
        try:
            df = pd.read_csv(file_path, encoding='ISO-8859-1', delimiter=sep, on_bad_lines='skip')
            if len(df.columns) > 1:
                columns = df.columns.tolist()
                if common_columns is None:
                    common_columns = set(columns)
                else:
                    common_columns = common_columns.intersection(columns)
                
                files_info[year] = {
                    'file_name': f'vehicules_{year}.csv',
                    'num_columns': len(columns),
                    'columns': columns
                }
                break  # Si nous avons trouvé un séparateur qui fonctionne, nous arrêtons les tentatives
        except Exception as e:
            continue  # Si une tentative échoue, nous essayons le séparateur suivant
    if year not in files_info:
        files_info[year] = {
            'file_name': f'vehicules_{year}.csv',
            'num_columns': 1,
            'columns': []  # Si toutes les tentatives échouent, nous mettons une liste vide par défaut
        }

# Affichage des informations sur les colonnes pour chaque fichier
for year, info in files_info.items():
    print(f"Année {year}:")
    print(f"Nom du fichier: {info['file_name']}")
    print(f"Nombre de colonnes: {info['num_columns']}")
    print(f"Noms des colonnes: {info['columns']}")
    print()

# Recherche des colonnes qui ne sont pas communes à tous les fichiers
if common_columns is not None:
    uncommon_columns = {}
    for year, info in files_info.items():
        uncommon_columns[year] = list(set(info['columns']) - common_columns)
    
    # Affichage des colonnes qui ne sont pas communes
    print("Colonnes qui ne sont pas communes à tous les fichiers :")
    for year, cols in uncommon_columns.items():
        if cols:
            print(f"Année {year}: {cols}")
else:
    print("Aucun fichier valide trouvé avec plusieurs colonnes.")



Année 2005:
Nom du fichier: vehicules_2005.csv
Nombre de colonnes: 1
Noms des colonnes: []

Année 2006:
Nom du fichier: vehicules_2006.csv
Nombre de colonnes: 1
Noms des colonnes: []

Année 2007:
Nom du fichier: vehicules_2007.csv
Nombre de colonnes: 1
Noms des colonnes: []

Année 2008:
Nom du fichier: vehicules_2008.csv
Nombre de colonnes: 1
Noms des colonnes: []

Année 2009:
Nom du fichier: vehicules_2009.csv
Nombre de colonnes: 1
Noms des colonnes: []

Année 2010:
Nom du fichier: vehicules_2010.csv
Nombre de colonnes: 1
Noms des colonnes: []

Année 2011:
Nom du fichier: vehicules_2011.csv
Nombre de colonnes: 1
Noms des colonnes: []

Année 2012:
Nom du fichier: vehicules_2012.csv
Nombre de colonnes: 1
Noms des colonnes: []

Année 2013:
Nom du fichier: vehicules_2013.csv
Nombre de colonnes: 1
Noms des colonnes: []

Année 2014:
Nom du fichier: vehicules_2014.csv
Nombre de colonnes: 1
Noms des colonnes: []

Année 2015:
Nom du fichier: vehicules_2015.csv
Nombre de colonnes: 1
Noms des co