# Regroupement des différents fichiers d'incendies

Ce notebook prend les différents csv d'extraction de la BDIFF qui ont été partiellement nettoyés par Chloé, les regroupe, et sort un nouveau csv qui est déposé dans le dossier "Données clean".

In [1]:
import requests
import pandas as pd
import time
import gdown
import os
import glob

In [2]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [3]:
# Définition du chemin d'accès au dossier
path_cat_nat = 'drive/My Drive/PIP 2025 /Catastrophes naturelles/Incendies/'
path_clean = 'drive/My Drive/PIP 2025 /Catastrophes naturelles/Données clean/'

In [4]:
# Trouver tous les fichiers CSV dans le dossier
csv_files = glob.glob(path_cat_nat + "*.csv")

# Liste pour stocker chaque DataFrame
df_list = []

# Lecture de chaque fichier CSV et ajout à la liste
for file in csv_files:
    print(f"📂 Lecture du fichier : {file}")  # Affiche les fichiers lus
    df = pd.read_csv(file, sep=";", encoding="utf-8-sig", dtype=str)  # Lecture avec encodage
    df_list.append(df)

# Concaténer tous les DataFrames en un seul
df_final = pd.concat(df_list, ignore_index=True)

# Vérifier le résultat
print(f"\n✅ Total de lignes après fusion : {df_final.shape[0]}")
print(f"✅ Total de colonnes : {df_final.shape[1]}")
print(df_final.head())  # Afficher les premières lignes du DataFrame final


📂 Lecture du fichier : drive/My Drive/PIP 2025 /Catastrophes naturelles/Incendies/2015_2023.csv
📂 Lecture du fichier : drive/My Drive/PIP 2025 /Catastrophes naturelles/Incendies/2007_2014.csv
📂 Lecture du fichier : drive/My Drive/PIP 2025 /Catastrophes naturelles/Incendies/1998_2006.csv
📂 Lecture du fichier : drive/My Drive/PIP 2025 /Catastrophes naturelles/Incendies/1990_1997.csv
📂 Lecture du fichier : drive/My Drive/PIP 2025 /Catastrophes naturelles/Incendies/1982_1989.csv

✅ Total de lignes après fusion : 4201
✅ Total de colonnes : 8
  Année Numéro Département Code INSEE   Nom de la commune  \
0  2015   2365          40      40320  Uchacq-et-Parentis   
1  2015   2362          40      40243     Rion-des-Landes   
2  2015   2360          40      40142             Laluque   
3  2015   2359          40      40310            Soustons   
4  2015   8281           6       6115       Saint-Antonin   

  Date de première alerte Surface parcourue (m2) Année   
0        05/08/2015 16:40       

In [5]:
df_final

Unnamed: 0,Année,Numéro,Département,Code INSEE,Nom de la commune,Date de première alerte,Surface parcourue (m2),Année.1
0,2015,2365,40,40320,Uchacq-et-Parentis,05/08/2015 16:40,3000,
1,2015,2362,40,40243,Rion-des-Landes,06/08/2015 13:48,10000,
2,2015,2360,40,40142,Laluque,06/08/2015 16:44,500,
3,2015,2359,40,40310,Soustons,06/08/2015 19:46,5000,
4,2015,8281,6,6115,Saint-Antonin,08/08/2015 16:11,800,
...,...,...,...,...,...,...,...,...
4196,1989,378,7,7315,Souche (La),28/08/1989 19:15,40000,
4197,1989,3011,83,83046,Cotignac,31/08/1989 17:52,200000,
4198,1989,3032,83,83029,Callian,10/09/1989 16:18,1000,
4199,1989,3074,83,83063,Garde-Freinet (La),08/10/1989 14:30,1000,


In [8]:
len(df_final)

4201

In [7]:
df_final[df_final['Département']=='974']

Unnamed: 0,Année,Numéro,Département,Code INSEE,Nom de la commune,Date de première alerte,Surface parcourue (m2),Année.1
47,2015.0,1163,974,97417,Saint-Philippe,23/10/2015 12:24,164000,
530,2019.0,1079,974,97415,Saint-Paul,31/08/2019 16:54,25,
539,2019.0,1097,974,97423,Les Trois-Bassins,07/09/2019 18:30,4924,
546,2019.0,1319,974,97407,Le Port,01/10/2019 10:18,21294,
1071,2023.0,11422,974,97421,Salazie,20/10/2023 13:34,15000,
1855,,518,974,97411,Saint-Denis,21/11/2012 15:20,20,2012.0
1943,,414,974,97415,Saint-Paul,27/08/2013 07:46,7000,2013.0
2019,,393,974,97407,Le Port,11/08/2014 15:23,2000,2014.0


In [9]:
df_final2 = df_final[df_final['Département'] != '974']

In [10]:
len(df_final2)

4193

In [11]:
# Exporter le DataFrame en CSV
df_final2.to_csv(path_clean+"catastrophes_naturelles_incendies.csv", index=False, encoding='utf-8-sig')

print("Extraction terminée ! Données enregistrées dans 'catastrophes_naturelles_incendies.csv'")

Extraction terminée ! Données enregistrées dans 'catastrophes_naturelles_incendies.csv'
