Notebook pour travailler sur la base de donnees des achats de pesticides par departement 

In [4]:
!pip install chardet 

Collecting chardet
  Downloading chardet-5.2.0-py3-none-any.whl.metadata (3.4 kB)
Downloading chardet-5.2.0-py3-none-any.whl (199 kB)
Installing collected packages: chardet
Successfully installed chardet-5.2.0


In [7]:
import requests
import zipfile
import os
import pandas as pd

# URL du fichier ZIP
url_zip = "https://data.ofb.fr/catalogue/Donnees-geographiques-OFB/api/records/a69c8e76-13e1-4f87-9f9d-1705468b7221/attachments/BNVD_TRACABILITE_20231024_ACHAT_2022.zip"

# Chemin pour stocker temporairement le fichier ZIP
zip_path = "data.zip"

# Télécharger le fichier ZIP
response = requests.get(url_zip)
with open(zip_path, "wb") as f:
    f.write(response.content)

# Extraire le contenu du fichier ZIP
extract_path = "data_extracted"
with zipfile.ZipFile(zip_path, "r") as zip_ref:
    zip_ref.extractall(extract_path)

# Identifier les fichiers extraits (y compris sous-dossiers)
for root, dirs, files in os.walk(extract_path):
    for file in files:
        if file.endswith(".csv"):
            csv_path = os.path.join(root, file)
            print(f"Chargement du fichier : {csv_path}")
            try:
                # Spécifiez un séparateur et l'encodage
                df = pd.read_csv(csv_path, sep=';', encoding='utf-8', on_bad_lines='skip') 
                print("Aperçu du fichier CSV chargé :")
                print(df.head())
            except pd.errors.ParserError as e:
                print(f"Erreur de parsing pour {csv_path} : {e}")
        elif file.endswith(".shp"):
            import geopandas as gpd
            shp_path = os.path.join(root, file)
            gdf = gpd.read_file(shp_path)
            print("Aperçu du fichier SHP chargé :")
            print(gdf.head())



Chargement du fichier : data_extracted/BNVD_TRACABILITE_20231023_ACHAT_FR_SUBSTANCE_2022.csv
Aperçu du fichier CSV chargé :
   annee      amm                              substance          cas  \
0   2022  1030003   polymere carboxyl sulfone cationique    8061-53-8   
1   2022  2000001                             glyphosate    1071-83-6   
2   2022  2000003                           metazachlore   67129-08-2   
3   2022  2000017                        tau-fluvalinate  102851-06-9   
4   2022  2000018  soufre pour pulverisation (micronise)    7704-34-9   

   quantite_substance classification classification_mention achat_etranger  
0        1.832631e+04          Autre                    NaN            Oui  
1        1.080000e+01          Env A                    NaN            Oui  
2        3.821093e+04            CMR                    NaN            Oui  
3        6.485280e+01          Env A                    NaN            Non  
4        1.737832e+06          Autre                

  df = pd.read_csv(csv_path, sep=';', encoding='utf-8', on_bad_lines='skip')
  df = pd.read_csv(csv_path, sep=';', encoding='utf-8', on_bad_lines='skip')


Aperçu du fichier CSV chargé :
   annee  code_postal_acheteur      amm  \
0   2022                 16000  2000018   
1   2022                 16000  2000316   
2   2022                 16000  2000327   
3   2022                 16000  2010130   
4   2022                 16000  2050046   

                               substance          cas quantite_substance  \
0  soufre pour pulverisation (micronise)    7704-34-9               64.0   
1                          esfenvalerate   66230-04-4                0.5   
2                    carfentrazone ethyl  128639-02-1                0.9   
3             cuivre de l'oxyde cuivreux    1317-39-1               30.0   
4                            flonicamide  158062-67-0               0.25   

  classification classification_mention achat_etranger  
0          Autre                    NaN            Non  
1        Santé A           Substitution            Non  
2          Env A                    NaN            Non  
3          Env A         

  df = pd.read_csv(csv_path, sep=';', encoding='utf-8', on_bad_lines='skip')
  df = pd.read_csv(csv_path, sep=';', encoding='utf-8', on_bad_lines='skip')


Aperçu du fichier CSV chargé :
   annee  code_postal_acheteur      amm quantite_produit conditionnement  eaj  \
0   2022                 44430  2150870                2               l  Non   
1   2022                 44000  2010513              1.5              kg  Non   
2   2022                 44000  2080105                5               l  Non   
3   2022                 44000  2090114              324              kg  Non   
4   2022                 44000  2090146                1               l  Oui   

  achat_etranger  
0            Non  
1            Non  
2            Non  
3            Non  
4            Non  
Chargement du fichier : data_extracted/BNVD_TRACABILITE_20231023_ACHAT_CP_SUBSTANCE_ILE DE FRANCE_2022.csv
Aperçu du fichier CSV chargé :
   annee  code_postal_acheteur      amm           substance          cas  \
0   2022                 75014  2170381          mesotrione  104206-82-8   
1   2022                 75014  2170381      terbuthylazine    5915-41-3   
2 

  df = pd.read_csv(csv_path, sep=';', encoding='utf-8', on_bad_lines='skip')


Aperçu du fichier CSV chargé :
   annee  code_postal_acheteur      amm quantite_produit conditionnement  eaj  \
0   2022                 59000  2000018               20              kg  Non   
1   2022                 59000  2010023              2.5               l  Non   
2   2022                 59000  2010239               10               l  Non   
3   2022                 59000  2060050             1.28               l  Non   
4   2022                 59000  2060085              2.5               l  Non   

  achat_etranger  
0            Non  
1            Non  
2            Non  
3            Non  
4            Non  
Chargement du fichier : data_extracted/BNVD_TRACABILITE_20231023_ACHAT_CP_PRODUIT_NOUVELLE AQUITAINE_2022.csv
Aperçu du fichier CSV chargé :
   annee  code_postal_acheteur      amm quantite_produit conditionnement  eaj  \
0   2022                 16000  2000018               80              kg  Non   
1   2022                 16190  2090137             1400         

  df = pd.read_csv(csv_path, sep=';', encoding='utf-8', on_bad_lines='skip')
  df = pd.read_csv(csv_path, sep=';', encoding='utf-8', on_bad_lines='skip')


Aperçu du fichier CSV chargé :
   annee  code_postal_acheteur      amm  \
0   2022                  2000  2000018   
1   2022                  2140  2150753   
2   2022                  2140  2150757   
3   2022                  2140  2150757   
4   2022                  2140  2150785   

                               substance          cas quantite_substance  \
0  soufre pour pulverisation (micronise)    7704-34-9              272.0   
1                        prothioconazole  178928-70-6              1.875   
2                         diflufenicanil   83164-33-4                0.8   
3                             glyphosate    1071-83-6                5.0   
4                             mesotrione  104206-82-8                2.5   

  classification classification_mention achat_etranger  
0          Autre                    NaN            Non  
1          Env A                    NaN            Non  
2          Env B                    NaN            Non  
3          Env A         

  df = pd.read_csv(csv_path, sep=';', encoding='utf-8', on_bad_lines='skip')
  df = pd.read_csv(csv_path, sep=';', encoding='utf-8', on_bad_lines='skip')


Aperçu du fichier CSV chargé :
   annee  code_postal_acheteur      amm      substance          cas  \
0   2022                 10000  2000003   metazachlore   67129-08-2   
1   2022                  8200  9500568    fludioxonil  131341-86-1   
2   2022                  8200  9500628      bentazone   25057-89-0   
3   2022                  8200  9600093  azoxystrobine  131860-33-8   
4   2022                  8200  9700332  azoxystrobine  131860-33-8   

  quantite_substance classification classification_mention achat_etranger  
0               18.0            CMR                    NaN            Non  
1               0.75          Env A                    NaN            Non  
2               5.22          Env B                    NaN            Non  
3                5.0        Santé A                    NaN            Non  
4                1.5        Santé A                    NaN            Non  
Chargement du fichier : data_extracted/BNVD_TRACABILITE_20231023_ACHAT_CP_SUBSTANCE_CE

  df = pd.read_csv(csv_path, sep=';', encoding='utf-8', on_bad_lines='skip')
  df = pd.read_csv(csv_path, sep=';', encoding='utf-8', on_bad_lines='skip')


Aperçu du fichier CSV chargé :
   annee code_departement  departement      amm  \
0   2022               00  INDETERMINE  1030003   
1   2022               00  INDETERMINE  2000017   
2   2022               00  INDETERMINE  2000018   
3   2022               00  INDETERMINE  2000044   
4   2022               00  INDETERMINE  2000087   

                               substance          cas  quantite_substance  \
0   polymere carboxyl sulfone cationique    8061-53-8           367.22388   
1                        tau-fluvalinate  102851-06-9             6.50400   
2  soufre pour pulverisation (micronise)    7704-34-9           470.75200   
3                      fluazifop-p-butyl   79241-46-6             0.12500   
4        cuivre de l'hydroxyde de cuivre   20427-59-2            18.75000   

  classification classification_mention achat_etranger  
0          Autre                    NaN            Non  
1          Env A                    NaN            Non  
2          Autre            

  df = pd.read_csv(csv_path, sep=';', encoding='utf-8', on_bad_lines='skip')
  df = pd.read_csv(csv_path, sep=';', encoding='utf-8', on_bad_lines='skip')


Aperçu du fichier CSV chargé :
   annee  code_postal_acheteur      amm          substance          cas  \
0   2022                 14460  2010240        florasulame  145701-23-1   
1   2022                 14220  2160724     difenoconazole  119446-68-3   
2   2022                 14220  2160752           pyridate   55512-33-9   
3   2022                 14220  2160818             soufre    7704-34-9   
4   2022                 14220  2160920  fluroxypyr-meptyl   81406-37-3   

  quantite_substance classification classification_mention achat_etranger  
0               0.05          Env A                    NaN            Non  
1              3.125          Env A                    NaN            Non  
2               24.0          Env A                    NaN            Non  
3               40.0          Autre                    NaN            Non  
4            12.6425          Env A                    NaN            Non  
Chargement du fichier : data_extracted/BNVD_TRACABILITE_202310

  return ogr_read(


Aperçu du fichier SHP chargé :
       gid  millesime code_cultu precision_  \
0  1057718       2023        SPH       None   
1  1057720       2023        MCR        001   
2  1057733       2023        LUZ        002   
3  1045691       2023        SPH       None   
4  1063649       2023        MLG        001   

                                          lbl_cultur         grp_cultur  \
0  Prairie avec herbe prédominante et ressources ...  Estives et landes   
1  Mélange de céréales ou pseudo-céréales d'hiver...    Autres céréales   
2                                      Autre luzerne           Fourrage   
3  Prairie avec herbe prédominante et ressources ...  Estives et landes   
4  Mélange de légumineuses prépondérantes et de g...           Fourrage   

   surface_ha code_commu         lbl_commun    code_epci code_depar  \
0        0.56      12294  Vézins-de-Lévézou  241200765.0         12   
1        2.22      12294  Vézins-de-Lévézou  241200765.0         12   
2        1.28      123