In [1]:
import pandas as pd
import os

# Fonction de détection du séparateur
def detect_separator(filepath):
    with open(filepath, "r", encoding="utf-8", errors="ignore") as f:
        line = f.readline()
        if ";" in line: return ";"
        elif "," in line: return ","
        else: return "\t"

base_path = "donnee_accident/Donnee_"
annees = [2005, 2008, 2011, 2014, 2017, 2020, 2023]


In [2]:
for an in annees:
    chemin_carac = f"{base_path}{an}/caracteristiques-{an}.csv"
    chemin_lieux = f"{base_path}{an}/lieux-{an}.csv"

    if not os.path.exists(chemin_carac) or not os.path.exists(chemin_lieux):
        print(f"⛔ Fichiers manquants pour {an}")
        continue

    try:
        sep_carac = detect_separator(chemin_carac)
        sep_lieux = detect_separator(chemin_lieux)

        carac = pd.read_csv(chemin_carac, sep=sep_carac, encoding="latin1", on_bad_lines="skip", low_memory=False)
        lieux = pd.read_csv(chemin_lieux, sep=sep_lieux, encoding="utf-8", on_bad_lines="skip")

        carac.columns = [c.strip().replace('"', '') for c in carac.columns]
        lieux.columns = [c.strip().replace('"', '') for c in lieux.columns]

        df = pd.merge(carac, lieux, on="Num_Acc", how="left")

        df["dep"] = df["dep"].astype(str).str.zfill(3)
        df["com"] = df["com"].astype(str).str.zfill(5)

        # 🧪 Filtres multiples pour détecter Bordeaux
        filtre_com = df["com"] == "33063"
        filtre_dep = df["dep"] == "330"
        filtre_adr = df["adr"].astype(str).str.contains("bordeaux", case=False, na=False)

        total_match = df[filtre_com | filtre_dep | filtre_adr]
        print(f"📊 {an} : {len(total_match)} lignes liées à Bordeaux")

        if len(total_match) > 0:
            print(total_match[["dep", "com", "adr"]].drop_duplicates().head(5))
        
    except Exception as e:
        print(f"❌ Erreur {an} : {e}")


📊 2005 : 2165 lignes liées à Bordeaux
     dep    com                       adr
466  330  498.0                       NaN
467  330  056.0                       NaN
468  330  312.0        RUE DURAND DASSIER
469  330  162.0     21 av de l hippodrome
470  330  162.0  avenue de Saint Mï¿½dard
📊 2008 : 2109 lignes liées à Bordeaux
   dep    com                      adr
0  330  00424         RUE SAINT JULIEN
1  330  00348                      NaN
2  330  00350  RD 231 Rue de l'hôpital
3  330  00394                      NaN
4  330  00394               La Moleone
📊 2011 : 1777 lignes liées à Bordeaux
      dep    com                       adr
3986  330  00498          2 route du Lanot
3987  330  00029                       NaN
3989  330  00436                       NaN
3990  330  00284   04 rue maréchal LECLERC
3991  330  00051  108 AVE DE LA LIBERATION
📊 2014 : 1633 lignes liées à Bordeaux
      dep    com                  adr
2402  330  00519                  NaN
2403  330  00042            

  lieux = pd.read_csv(chemin_lieux, sep=sep_lieux, encoding="utf-8", on_bad_lines="skip")


📊 2017 : 1185 lignes liées à Bordeaux
      dep    com                   adr
798   140  00187    CHEMIN DE BORDEAUX
1162  330  00029  avenue du sauternais
1163  330  00498   RD 108 - PR 040+400
1164  330  00498      RD3 / Ch.Jacques
1165  330  00436         Route du Barp
📊 2020 : 260 lignes liées à Bordeaux
      dep    com                                          adr
192   033  33063     CRS DU MEDOC / CRS BALGUERIE STUTTENBERG
497   033  33063                           ALL DE LOS ANGELES
1083  033  33063                      Rue de la Motte Picquet
1379  033  33063  RUE DES GENERAUX D/UCHE / RUE PIERRE TREBOD
1787  033  33063            CRS VICTOR HUGO / RUE SAINT-JAMES
📊 2023 : 357 lignes liées à Bordeaux
      dep    com                                    adr
75    033  33019                38bis Route de Bordeaux
463   033  33205  A62 PK 021.100 sens BORDEAUX-TOULOUSE
1175  033  33063                             Rue Tastet
1428  033  33063                       Avenue de Verdun
15

  lieux = pd.read_csv(chemin_lieux, sep=sep_lieux, encoding="utf-8", on_bad_lines="skip")
