In [1]:
import duckdb

## Objectif : récupérer facilement la liste des paramètres PFAS ou filtrer facilement les analyses sur les PFAS uniquement

In [2]:
# connection à la db
con = duckdb.connect(database="./../../database/data.duckdb", read_only=True)

In [3]:
# récupération de la liste des paramètres de la DB
params_uniques = con.execute(
    "SELECT DISTINCT cdparametresiseeaux, libminparametre, casparam FROM edc_resultats"
).df()

Ci-dessous la liste des 21 PFAS identifiés par Thomas.  

Note : la liste initiale était de 20, à laquelle j'ai rajouté le Sulfonate de perfluorooctane, qui est exactement la même molécule que l'Acide sulfonique de perfluorooctane, mais dont le nom et le CAS sont maintenant obsolètes. (source : http://id.eaufrance.fr/par/6561 - voir "Commentaires sur le paramètre")

In [4]:
liste_pfas = [
    "Acide perfluorobutanoïque",
    "Perfluorobutane sulfonate",
    "Acide perfluoro-decanoïque",
    "Acide perfluorododécanoique (PFDoDA)",
    "Acide perfluorododécane sulfonique (PFDoDS)",
    "Acide perfluorodecane sulfonique ",
    "Acide perfluoroheptanoïque",
    "Acide perfluoroheptane sulfonique (PFHpS)",
    "Acide perfluorohexanoïque",
    "Perfluorohexane sulfonate",
    "Acide perfluoro-nonanoïque",
    "Acide perfluorononane sulfonique (PFNS)",
    "Acide perfluoro-octanoïque",
    "Acide sulfonique de perfluorooctane",
    "Acide perfluoropentanoïque",
    "Acide perfluoropentane sulfonique (PFPS)",
    "Acide perfluoro tridecanoique (PFTrDA)",
    "Acide perfluoro tridecane sulfonique (PFTrDS)",
    "Acide perfluoro undecanoïque (PFUnA)",
    "Acide perfluoro undecane sulfonique (PFUnDS)",
    "Sulfonate de perfluorooctane",
]

On récupère les paramètres qui font partie de cette liste.

In [5]:
from_list = params_uniques[
    params_uniques["libminparametre"].apply(lambda x: x in liste_pfas)
]
from_list

Unnamed: 0,cdparametresiseeaux,libminparametre,casparam
150,PFBS,Perfluorobutane sulfonate,59933-66-3
151,PFDODA,Acide perfluorododécanoique (PFDoDA),307-55-1
152,PFDS,Acide perfluorodecane sulfonique,335-77-3
153,PFHPA,Acide perfluoroheptanoïque,375-85-9
349,PFBA,Acide perfluorobutanoïque,375-22-4
350,PFPEA,Acide perfluoropentanoïque,2706-90-3
351,PFPS,Acide perfluoropentane sulfonique (PFPS),2706-91-4
352,PFTRDS,Acide perfluoro tridecane sulfonique (PFTrDS),791563-89-8
563,PFNA,Acide perfluoro-nonanoïque,375-95-1
727,PFHXA,Acide perfluorohexanoïque,307-24-4


On remarque que tous les cdparametresiseeaux semblent commencer par PF, on va tenter d'obtenir la même liste en recherchant les paramètres qui commencent par PF.

In [6]:
from_paramsise = params_uniques[
    params_uniques["cdparametresiseeaux"].str.startswith("PF")
]

On vérifie que les df sont égaux.

In [7]:
from_list == from_paramsise

Unnamed: 0,cdparametresiseeaux,libminparametre,casparam
150,True,True,True
151,True,True,True
152,True,True,True
153,True,True,True
349,True,True,True
350,True,True,True
351,True,True,True
352,True,True,True
563,True,True,True
727,True,True,True


## Conclusion

Pour récupérer la liste des PFAS depuis la bdd actuelle, ou filtrer uniquement les résultats d'analyse concernant les PFAS, plutôt que de copier/coller une liste à chaque fois, vous pouvez directement faire un filtre sur le champ 'cdparametresiseeaux'. Ci-dessous un exemple SQL pour récupérer les paramètres PFAS.

In [8]:
con.execute(
    "SELECT DISTINCT cdparametresiseeaux, libminparametre, casparam FROM edc_resultats WHERE cdparametresiseeaux LIKE 'PF%'"
).df()

Unnamed: 0,cdparametresiseeaux,libminparametre,casparam
0,PFBS,Perfluorobutane sulfonate,59933-66-3
1,PFDODA,Acide perfluorododécanoique (PFDoDA),307-55-1
2,PFDS,Acide perfluorodecane sulfonique,335-77-3
3,PFHPA,Acide perfluoroheptanoïque,375-85-9
4,PFBA,Acide perfluorobutanoïque,375-22-4
5,PFPEA,Acide perfluoropentanoïque,2706-90-3
6,PFPS,Acide perfluoropentane sulfonique (PFPS),2706-91-4
7,PFTRDS,Acide perfluoro tridecane sulfonique (PFTrDS),791563-89-8
8,PFNA,Acide perfluoro-nonanoïque,375-95-1
9,PFDODS,Acide perfluorododécane sulfonique (PFDoDS),79780-39-5


Et un exemple pour récupérer les analyses des PFAS uniquement

In [12]:
con.execute(
    "SELECT * FROM edc_resultats WHERE cdparametresiseeaux LIKE 'PF%'"
).df().sort_values("referenceprel").head(10)

Unnamed: 0,cddept,referenceprel,cdparametresiseeaux,cdparametre,libmajparametre,libminparametre,libwebparametre,qualitparam,insituana,rqana,cdunitereferencesiseeaux,cdunitereference,limitequal,refqual,valtraduite,casparam,referenceanl,de_partition,de_ingestion_date
143,1,100138847,PFHXS,6830,PERFLUOROHEXANE SULFONATE,Perfluorohexane sulfonate,,N,L,00077,µg/L,133,,,0.0077,355-46-4,100147619,2023,2025-02-07
136,1,100138847,PFDA,6509,ACIDE PERFLUORO-DECANOÏQUE,Acide perfluoro-decanoïque,,N,L,"<0,001",µg/L,133,,,0.0,335-76-2,100147619,2023,2025-02-07
137,1,100138847,PFDODA,6507,ACIDE PERFLUORODODÉCANOIQUE,Acide perfluorododécanoique (PFDoDA),,N,L,"<0,001",µg/L,133,,,0.0,307-55-1,100147619,2023,2025-02-07
138,1,100138847,PFDODS,8741,ACIDE PERFLUORODODÉCANE SULFONIQUE,Acide perfluorododécane sulfonique (PFDoDS),,N,L,"<0,01",µg/L,133,,,0.0,79780-39-5,100147619,2023,2025-02-07
139,1,100138847,PFDS,6550,ACIDE PERFLUORODECANE SULFONIQUE,Acide perfluorodecane sulfonique,,N,L,"<0,01",µg/L,133,,,0.0,335-77-3,100147619,2023,2025-02-07
140,1,100138847,PFHPA,5977,ACIDE PERFLUOROHEPTANOÏQUE,Acide perfluoroheptanoïque,,N,L,"<0,001",µg/L,133,,,0.0,375-85-9,100147619,2023,2025-02-07
141,1,100138847,PFHPS,6542,ACIDE PERFLUOROHEPTANE SULFONIQUE,Acide perfluoroheptane sulfonique (PFHpS),,N,L,"<0,001",µg/L,133,,,0.0,375-92-8,100147619,2023,2025-02-07
142,1,100138847,PFHXA,5978,ACIDE PERFLUOROHEXANOÏQUE,Acide perfluorohexanoïque,,N,L,00038,µg/L,133,,,0.0038,307-24-4,100147619,2023,2025-02-07
144,1,100138847,PFNA,6508,ACIDE PERFLUORO-NONANOÏQUE,Acide perfluoro-nonanoïque,,N,L,"<0,001",µg/L,133,,,0.0,375-95-1,100147619,2023,2025-02-07
145,1,100138847,PFNS,8739,ACIDE PERFLUORONONANE SULFONIQUE,Acide perfluorononane sulfonique (PFNS),,N,L,"<0,01",µg/L,133,,,0.0,68259-12-1,100147619,2023,2025-02-07
