# Calcul du nombre de prélèvements Perchlorate non conforme par commune et par année

L'objectif de ce notebook est de partir de la liste de communes cog_communes, et pour chaque commune et chaque année, calculer le nombre de prélèvements non conformes pour le Perchlorate.

Pour créer ce notebook on a utilisé les codes de notebook cvm_calcul_conformite_par_commune.ipynb, sur ce lien https://github.com/dataforgoodfr/13_pollution_eau/pull/65

Il y aura plusieurs aggrégations à faire :

- commune (inseecommune) peut avoir plusieurs UDIs (cdreseau)
- un prélèvement (referenceprel) peut être rattaché à plusieurs UDIs (cdreseau)
- un prélèvement (referenceprel) peut être composé de plusieurs paramètres (cdparametresiseeaux) ; mais dans le cas du Perchlorate (comme CVM), il y a un seul paramètre selon la catégorisation de Pauline, donc c'est plus simple

La résultat final est dans la dernière cellule. Toutes les cellules précédentes sont là pour aider à la compréhension, en présentant des résultats intermédiaires.


In [1]:
%load_ext sql
%sql duckdb:///../../database/data.duckdb
%config SqlMagic.displaylimit = 10

In [2]:
%sqlcmd tables

Name
ana__resultats_communes
cog_communes
edc_communes
edc_prelevements
edc_resultats
laposte_communes
mapping_categories


In [3]:
%sql select * from cog_communes

TYPECOM,COM,REG,DEP,CTCD,ARR,TNCC,NCC,NCCENR,LIBELLE,CAN,COMPARENT,de_partition,de_ingestion_date,de_dataset_datetime
COM,1001,84,1,01D,12,5,ABERGEMENT CLEMENCIAT,Abergement-Clémenciat,L'Abergement-Clémenciat,108,,2024,2025-03-07,20240220
COM,1002,84,1,01D,11,5,ABERGEMENT DE VAREY,Abergement-de-Varey,L'Abergement-de-Varey,101,,2024,2025-03-07,20240220
COM,1004,84,1,01D,11,1,AMBERIEU EN BUGEY,Ambérieu-en-Bugey,Ambérieu-en-Bugey,101,,2024,2025-03-07,20240220
COM,1005,84,1,01D,12,1,AMBERIEUX EN DOMBES,Ambérieux-en-Dombes,Ambérieux-en-Dombes,122,,2024,2025-03-07,20240220
COM,1006,84,1,01D,11,1,AMBLEON,Ambléon,Ambléon,104,,2024,2025-03-07,20240220
COM,1007,84,1,01D,11,1,AMBRONAY,Ambronay,Ambronay,101,,2024,2025-03-07,20240220
COM,1008,84,1,01D,11,1,AMBUTRIX,Ambutrix,Ambutrix,101,,2024,2025-03-07,20240220
COM,1009,84,1,01D,11,1,ANDERT ET CONDON,Andert-et-Condon,Andert-et-Condon,104,,2024,2025-03-07,20240220
COM,1010,84,1,01D,11,1,ANGLEFORT,Anglefort,Anglefort,110,,2024,2025-03-07,20240220
COM,1011,84,1,01D,14,1,APREMONT,Apremont,Apremont,114,,2024,2025-03-07,20240220


In [4]:
%sql select *  from edc_communes

inseecommune,nomcommune,quartier,cdreseau,nomreseau,debutalim,de_partition,de_ingestion_date,de_dataset_datetime
1001,ABERGEMENT-CLEMENCIAT (L'),-,1000556,BDS ST DIDIER/CHALARONNE,2010-09-07,2020,2025-02-14,20230811-150005
1002,ABERGEMENT-DE-VAREY (L'),-,1000369,L'ABERGEMENT-DE-VAREY,2010-09-07,2020,2025-02-14,20230811-150005
1004,AMBERIEU-EN-BUGEY,Vareilles,1000248,AMBERIEU VAREILLES,2010-09-07,2020,2025-02-14,20230811-150005
1004,AMBERIEU-EN-BUGEY,St Germain_Brédevent,1000249,AMBERIEU SAINT GERMAIN DOUVRES,2010-09-07,2020,2025-02-14,20230811-150005
1004,AMBERIEU-EN-BUGEY,ville,1000251,AMBERIEU VILLE,2010-09-07,2020,2025-02-14,20230811-150005
1005,AMBERIEUX-EN-DOMBES,Est,1000850,BDS CHATANIER,2023-01-01,2020,2025-02-14,20230811-150005
1005,AMBERIEUX-EN-DOMBES,Ouest,1000850,BDS CHATANIER,2021-08-01,2020,2025-02-14,20230811-150005
1006,AMBLEON,-,1000235,AMBLEON,2010-09-07,2020,2025-02-14,20230811-150005
1007,AMBRONAY,-,1000003,AMBRONAY,2010-09-07,2020,2025-02-14,20230811-150005
1008,AMBUTRIX,Ambutrix centre,1000254,AMBUTRIX MAIRIE,2010-09-07,2020,2025-02-14,20230811-150005


In [5]:
%sql select *  from edc_prelevements

cddept,cdreseau,inseecommuneprinc,nomcommuneprinc,cdreseauamont,nomreseauamont,pourcentdebit,referenceprel,dateprel,heureprel,conclusionprel,ugelib,distrlib,moalib,plvconformitebacterio,plvconformitechimique,plvconformitereferencebact,plvconformitereferencechim,de_partition,de_ingestion_date,de_dataset_datetime
1,1000003,1007,AMBRONAY,,,,100119766,2020-02-13,11h40,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,1001304.0,TTP (CLG) AMBRONAY,100 %,100120290,2020-03-17,11h15,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,,,,100120717,2020-05-14,11h54,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,,,,100121072,2020-06-11,12h00,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,,,,100121547,2020-07-08,11h09,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,1001304.0,TTP (CLG) AMBRONAY,100 %,100121589,2020-07-08,09h05,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,,,,100122035,2020-08-13,10h44,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,,,,100122549,2020-09-14,12h51,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,,,,100123096,2020-10-12,08h25,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,1001304.0,TTP (CLG) AMBRONAY,100 %,100123173,2020-10-12,09h15,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005


In [6]:
%%sql 
SELECT categorie, COUNT(categorie) FROM mapping_categories
group by categorie

categorie,count(categorie)
perchlorate,1
phénol,23
non classé,139
cvm,1
métaux lourds,25
pesticides,674
métabolite de pesticide,127
médicament,5
hydrocarbure,163
dioxine et furane,17


In [7]:
%%sql 
SELECT * FROM mapping_categories
where categorie == 'perchlorate'

cdparametresiseeaux,cdparametre,libmajparametre,libminparametre,casparam,categorie
PCLAT,6219,PERCHLORATE,Perchlorate,14797-73-0,perchlorate


In [8]:
%%sql
    select *
    from "edc_resultats"
    where cdparametresiseeaux = 'PCLAT'
# on liste l'ensemble des analyses non conformes pour le paramètre PCLAT

cddept,referenceprel,cdparametresiseeaux,cdparametre,libmajparametre,libminparametre,libwebparametre,qualitparam,insituana,rqana,cdunitereferencesiseeaux,cdunitereference,limitequal,refqual,valtraduite,casparam,referenceanl,de_partition,de_ingestion_date,de_dataset_datetime
2,200178364,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,<1,µg/L,133,,,0.0,14797-73-0,200179474,2020,2025-02-14,20230811-150005
2,200178377,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,67,µg/L,133,,,6.7,14797-73-0,200179487,2020,2025-02-14,20230811-150005
2,200178394,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,<1,µg/L,133,,,0.0,14797-73-0,200179504,2020,2025-02-14,20230811-150005
2,200178471,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,<1,µg/L,133,,,0.0,14797-73-0,200179581,2020,2025-02-14,20230811-150005
2,200178481,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,56,µg/L,133,,,5.6,14797-73-0,200179591,2020,2025-02-14,20230811-150005
2,200178489,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,<1,µg/L,133,,,0.0,14797-73-0,200179599,2020,2025-02-14,20230811-150005
2,200178496,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,<1,µg/L,133,,,0.0,14797-73-0,200179606,2020,2025-02-14,20230811-150005
2,200178505,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,<1,µg/L,133,,,0.0,14797-73-0,200179615,2020,2025-02-14,20230811-150005
2,200178508,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,<1,µg/L,133,,,0.0,14797-73-0,200179618,2020,2025-02-14,20230811-150005
2,200178518,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,56,µg/L,133,,,5.6,14797-73-0,200179628,2020,2025-02-14,20230811-150005


On constate qu'il n'y a pas de limite de qualité pour ce paramètre dans les données. ALors on a trouvé ces informations sur le site sante.gouv https://sante.gouv.fr/sante-et-environnement/eaux/article/perchlorates-dans-l-eau-du-robinet

- L’Anses dans son avis du 20 juillet 2012 conclut qu’au vu des données disponibles à ce jour, un dépassement modéré de la valeur de 15 µg/L chez l’adulte, notamment chez la femme enceinte, et de 4 µg/L chez le nouveau-né ne semble pas associé à des effets cliniquement décelables.
- On va prendre 15 µg/L comme limite de qualité.


In [9]:
%%sql
    select *
    from "edc_resultats"
    where cdparametresiseeaux = 'PCLAT' and valtraduite > 15

# on liste l'ensemble des analyses non conformes pour le paramètre Perchlorate

cddept,referenceprel,cdparametresiseeaux,cdparametre,libmajparametre,libminparametre,libwebparametre,qualitparam,insituana,rqana,cdunitereferencesiseeaux,cdunitereference,limitequal,refqual,valtraduite,casparam,referenceanl,de_partition,de_ingestion_date,de_dataset_datetime
2,200178873,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,18,µg/L,133,,,18.0,14797-73-0,200179983,2020,2025-02-14,20230811-150005
2,200180674,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,23,µg/L,133,,,23.0,14797-73-0,200181784,2020,2025-02-14,20230811-150005
2,200181257,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,18,µg/L,133,,,18.0,14797-73-0,200182367,2020,2025-02-14,20230811-150005
2,200181325,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,32,µg/L,133,,,32.0,14797-73-0,200182435,2020,2025-02-14,20230811-150005
2,200181506,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,18,µg/L,133,,,18.0,14797-73-0,200182616,2020,2025-02-14,20230811-150005
2,200181697,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,18,µg/L,133,,,18.0,14797-73-0,200182807,2020,2025-02-14,20230811-150005
2,200181716,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,17,µg/L,133,,,17.0,14797-73-0,200182826,2020,2025-02-14,20230811-150005
2,200182038,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,45,µg/L,133,,,45.0,14797-73-0,200183148,2020,2025-02-14,20230811-150005
2,200182339,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,47,µg/L,133,,,47.0,14797-73-0,200183449,2020,2025-02-14,20230811-150005
2,200182417,PCLAT,6219,PERCHLORATE,Perchlorate,,N,L,27,µg/L,133,,,27.0,14797-73-0,200183527,2020,2025-02-14,20230811-150005


In [10]:
%%sql

with "resultats_pclat" as (
    select
      *,
      (CASE WHEN valtraduite > 15 THEN 1 ELSE 0 END) AS is_non_conforme
    from "edc_resultats"
    where cdparametresiseeaux = 'PCLAT'
),
"prelevements_pclat" as (
    select
        "cdreseau",
        "resultats_pclat"."de_partition",
        SUM(is_non_conforme) as "nbr_resultats_non_conformes",
        count(*) as "nbr_resultats_total",
        string_agg(CASE WHEN is_non_conforme = 1 THEN "resultats_pclat"."referenceprel" ELSE null END) as "list_referenceprels_non_conformes",
        string_agg(CASE WHEN is_non_conforme = 1 THEN "valtraduite" ELSE null END) as "list_valtraduite_non_conformes"
    from "resultats_pclat"
    left join "edc_prelevements" on
        "edc_prelevements"."referenceprel" = "resultats_pclat"."referenceprel"
        and
        "edc_prelevements"."de_partition" = "resultats_pclat"."de_partition"
    group by "cdreseau", "resultats_pclat"."de_partition"
)
select * from "prelevements_pclat" where "nbr_resultats_non_conformes" > 0

cdreseau,de_partition,nbr_resultats_non_conformes,nbr_resultats_total,list_referenceprels_non_conformes,list_valtraduite_non_conformes
80003918,2022,2,2,0800011426508000114852,"25.0,25.0"
45000454,2020,1,1,04500143421,28.69
54001835,2020,1,4,05400144355,18.02
62000726,2020,1,1,06200241319,21.21
62000847,2020,1,1,06200242263,22.46
62000794,2023,1,3,06200277547,21.6
55000886,2023,2,5,0550011776605500118237,"28.2,41.0"
62000585,2023,1,2,06200273853,33.55
80003916,2021,1,1,08000111087,25.0
62000714,2022,1,1,06200261953,29.29


In [11]:
%%sql

with "resultats_pclat" as (
    select
      *,
      (CASE WHEN valtraduite > 15 THEN 1 ELSE 0 END) AS is_non_conforme
    from "edc_resultats"
    where cdparametresiseeaux = 'PCLAT'
),
"prelevements_pclat" as (
    select
        "cdreseau",
        "resultats_pclat"."de_partition",
        SUM(is_non_conforme) as "nbr_resultats_non_conformes",
        count(*) as "nbr_resultats_total"
    from "resultats_pclat"
    left join "edc_prelevements" on
        "edc_prelevements"."referenceprel" = "resultats_pclat"."referenceprel"
        and
        "edc_prelevements"."de_partition" = "resultats_pclat"."de_partition"
    group by "cdreseau", "resultats_pclat"."de_partition"
),
"communes_pclat" as (
    select
        "inseecommune",
        "edc_communes"."de_partition",
        coalesce(sum("nbr_resultats_non_conformes"), 0) as "nbr_resultats_non_conformes",
        coalesce(sum("nbr_resultats_total"), 0) as "nbr_resultats_total",
        case
            when sum("nbr_resultats_non_conformes") > 0 then 'non conforme'
            when sum("nbr_resultats_total") > 0 then 'conforme'
            else 'non analysé'
        end as "resultat"
    from "edc_communes"
    left join "prelevements_pclat" on
        "prelevements_pclat"."cdreseau" = "edc_communes"."cdreseau"
        and
        "prelevements_pclat"."de_partition" = "edc_communes"."de_partition"
    group by "inseecommune", "edc_communes"."de_partition"
)
select * from communes_pclat where "nbr_resultats_non_conformes" > 0


inseecommune,de_partition,nbr_resultats_non_conformes,nbr_resultats_total,resultat
59048,2022,2,3,non conforme
59552,2022,2,2,non conforme
62003,2022,1,1,non conforme
62570,2022,1,1,non conforme
62718,2022,2,3,non conforme
62873,2022,1,2,non conforme
80397,2022,2,2,non conforme
80685,2022,1,1,non conforme
2532,2023,1,1,non conforme
59092,2023,1,6,non conforme


In [12]:
%%sql

with "resultats_pclat" as (
    select
      *,
      (CASE WHEN valtraduite > 15 THEN 1 ELSE 0 END) AS is_non_conforme
    from "edc_resultats"
    where cdparametresiseeaux = 'PCLAT'
),
"prelevements_pclat" as (
    select
        "cdreseau",
        "resultats_pclat"."de_partition",
        SUM(is_non_conforme) as "nbr_resultats_non_conformes",
        count(*) as "nbr_resultats_total"
    from "resultats_pclat"
    left join "edc_prelevements" on
        "edc_prelevements"."referenceprel" = "resultats_pclat"."referenceprel"
        and
        "edc_prelevements"."de_partition" = "resultats_pclat"."de_partition"
    group by "cdreseau", "resultats_pclat"."de_partition"
),
"communes_pclat" as (
    select
        "inseecommune",
        "edc_communes"."de_partition",
        coalesce(sum("nbr_resultats_non_conformes"), 0) as "nbr_resultats_non_conformes",
        coalesce(sum("nbr_resultats_total"), 0) as "nbr_resultats_total",
        case
            when sum("nbr_resultats_non_conformes") > 0 then 'non conforme'
            when sum("nbr_resultats_total") > 0 then 'conforme'
            else 'non analysé'
        end as "resultat"
    from "edc_communes"
    left join "prelevements_pclat" on
        "prelevements_pclat"."cdreseau" = "edc_communes"."cdreseau"
        and
        "prelevements_pclat"."de_partition" = "edc_communes"."de_partition"
    group by "inseecommune", "edc_communes"."de_partition"
),
"annees" as (SELECT unnest(generate_series(2020, 2024)) as "annee")
select
    "cog"."COM" as "commune_code_insee",
    "cog"."LIBELLE" as "commune_nom",
    a."annee",
    coalesce("resultat", 'non analysé') as "resultat_pclat"
from "cog_communes" as "cog"
cross join 
    "annees" a
left join "communes_pclat" on
   "cog"."COM" = "communes_pclat"."inseecommune"
   and
   a."annee"::string =  "communes_pclat"."de_partition"


commune_code_insee,commune_nom,annee,resultat_pclat
1001,L'Abergement-Clémenciat,2020,non analysé
1002,L'Abergement-de-Varey,2020,non analysé
1004,Ambérieu-en-Bugey,2020,non analysé
1005,Ambérieux-en-Dombes,2020,non analysé
1006,Ambléon,2020,non analysé
1007,Ambronay,2020,non analysé
1008,Ambutrix,2020,non analysé
1009,Andert-et-Condon,2020,non analysé
1010,Anglefort,2020,non analysé
1011,Apremont,2020,non analysé
