# Calcul du nombre de prélèvements CVM non conforme par commune et par année

L'objectif de ce notebook est de partir de la liste de communes cog_communes, et pour chaque commune et chaque année, calculer le nombre de prélèvements non conformes pour le CVM.

Il y aura plusieurs aggrégations à faire :
- commune (inseecommune) peut avoir plusieurs UDIs (cdreseau)
- un prélèvement (referenceprel) peut être rattaché à plusieurs UDIs (cdreseau)
- un prélèvement (referenceprel) peut être composé de plusieurs paramètres (cdparametresiseeaux) ; mais dans le cas du CVM, il y a un seul paramètre selon la catégorisation de Pauline, donc c'est plus simple


La résultat final est dans la dernière cellule. Toutes les cellules précédentes sont là pour aider à la compréhension, en présentant des résultats intermédiaires.

In [1]:
%load_ext sql
%sql duckdb:///../../database/data.duckdb
%config SqlMagic.displaylimit = 10


In [2]:
%sqlcmd tables

Name
edc_communes
edc_prelevements
edc_resultats
mapping_categories


In [3]:
%sql select * from read_csv("https://www.insee.fr/fr/statistiques/fichier/7766585/v_commune_2024.csv", header=true)

TYPECOM,COM,REG,DEP,CTCD,ARR,TNCC,NCC,NCCENR,LIBELLE,CAN,COMPARENT
COM,1001,84,1,01D,12,5,ABERGEMENT CLEMENCIAT,Abergement-Clémenciat,L'Abergement-Clémenciat,108,
COM,1002,84,1,01D,11,5,ABERGEMENT DE VAREY,Abergement-de-Varey,L'Abergement-de-Varey,101,
COM,1004,84,1,01D,11,1,AMBERIEU EN BUGEY,Ambérieu-en-Bugey,Ambérieu-en-Bugey,101,
COM,1005,84,1,01D,12,1,AMBERIEUX EN DOMBES,Ambérieux-en-Dombes,Ambérieux-en-Dombes,122,
COM,1006,84,1,01D,11,1,AMBLEON,Ambléon,Ambléon,104,
COM,1007,84,1,01D,11,1,AMBRONAY,Ambronay,Ambronay,101,
COM,1008,84,1,01D,11,1,AMBUTRIX,Ambutrix,Ambutrix,101,
COM,1009,84,1,01D,11,1,ANDERT ET CONDON,Andert-et-Condon,Andert-et-Condon,104,
COM,1010,84,1,01D,11,1,ANGLEFORT,Anglefort,Anglefort,110,
COM,1011,84,1,01D,14,1,APREMONT,Apremont,Apremont,114,


In [4]:
%sql select *  from edc_communes

inseecommune,nomcommune,quartier,cdreseau,nomreseau,debutalim,de_partition,de_ingestion_date,de_dataset_datetime
1001,ABERGEMENT-CLEMENCIAT (L'),-,1000556,BDS ST DIDIER/CHALARONNE,2010-09-07,2020,2025-02-14,20230811-150005
1002,ABERGEMENT-DE-VAREY (L'),-,1000369,L'ABERGEMENT-DE-VAREY,2010-09-07,2020,2025-02-14,20230811-150005
1004,AMBERIEU-EN-BUGEY,Vareilles,1000248,AMBERIEU VAREILLES,2010-09-07,2020,2025-02-14,20230811-150005
1004,AMBERIEU-EN-BUGEY,St Germain_Brédevent,1000249,AMBERIEU SAINT GERMAIN DOUVRES,2010-09-07,2020,2025-02-14,20230811-150005
1004,AMBERIEU-EN-BUGEY,ville,1000251,AMBERIEU VILLE,2010-09-07,2020,2025-02-14,20230811-150005
1005,AMBERIEUX-EN-DOMBES,Est,1000850,BDS CHATANIER,2023-01-01,2020,2025-02-14,20230811-150005
1005,AMBERIEUX-EN-DOMBES,Ouest,1000850,BDS CHATANIER,2021-08-01,2020,2025-02-14,20230811-150005
1006,AMBLEON,-,1000235,AMBLEON,2010-09-07,2020,2025-02-14,20230811-150005
1007,AMBRONAY,-,1000003,AMBRONAY,2010-09-07,2020,2025-02-14,20230811-150005
1008,AMBUTRIX,Ambutrix centre,1000254,AMBUTRIX MAIRIE,2010-09-07,2020,2025-02-14,20230811-150005


In [5]:
%sql select *  from edc_prelevements

cddept,cdreseau,inseecommuneprinc,nomcommuneprinc,cdreseauamont,nomreseauamont,pourcentdebit,referenceprel,dateprel,heureprel,conclusionprel,ugelib,distrlib,moalib,plvconformitebacterio,plvconformitechimique,plvconformitereferencebact,plvconformitereferencechim,de_partition,de_ingestion_date,de_dataset_datetime
1,1000003,1007,AMBRONAY,,,,100119766,2020-02-13,11h40,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,1001304.0,TTP (CLG) AMBRONAY,100 %,100120290,2020-03-17,11h15,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,,,,100120717,2020-05-14,11h54,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,,,,100121072,2020-06-11,12h00,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,,,,100121547,2020-07-08,11h09,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,1001304.0,TTP (CLG) AMBRONAY,100 %,100121589,2020-07-08,09h05,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,,,,100122035,2020-08-13,10h44,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,,,,100122549,2020-09-14,12h51,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,,,,100123096,2020-10-12,08h25,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005
1,1000003,1007,AMBRONAY,1001304.0,TTP (CLG) AMBRONAY,100 %,100123173,2020-10-12,09h15,Eau d'alimentation conforme aux exigences de qualité en vigueur pour l'ensemble des paramètres mesurés.,SI REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,SIE REGION D'AMBERIEU-EN-BUGEY,C,C,C,C,2020,2025-02-14,20230811-150005


In [6]:
%%sql
    select *
    from "edc_resultats"
    where cdparametresiseeaux = 'CLVYL' and valtraduite > 0.5

# on liste l'ensemble des analyses non conformes pour le paramètre CVM

cddept,referenceprel,cdparametresiseeaux,cdparametre,libmajparametre,libminparametre,libwebparametre,qualitparam,insituana,rqana,cdunitereferencesiseeaux,cdunitereference,limitequal,refqual,valtraduite,casparam,referenceanl,de_partition,de_ingestion_date,de_dataset_datetime
2,200180193,CLVYL,1753,CHLORURE DE VINYL MONOMÈRE,Chlorure de vinyl monomère,,N,L,10,µg/L,133,<=0.5 µg/L,,1.0,75-01-4,200181303,2020,2025-02-14,20230811-150005
4,400122403,CLVYL,1753,CHLORURE DE VINYL MONOMÈRE,Chlorure de vinyl monomère,,N,L,64,µg/L,133,<=0.5 µg/L,,0.64,75-01-4,400122467,2020,2025-02-14,20230811-150005
4,400122776,CLVYL,1753,CHLORURE DE VINYL MONOMÈRE,Chlorure de vinyl monomère,,N,L,529,µg/L,133,<=0.5 µg/L,,0.529,75-01-4,400122840,2020,2025-02-14,20230811-150005
4,400123465,CLVYL,1753,CHLORURE DE VINYL MONOMÈRE,Chlorure de vinyl monomère,,N,L,531,µg/L,133,<=0.5 µg/L,,0.531,75-01-4,400123529,2020,2025-02-14,20230811-150005
4,400123960,CLVYL,1753,CHLORURE DE VINYL MONOMÈRE,Chlorure de vinyl monomère,,N,L,200,µg/L,133,<=0.5 µg/L,,2.0,75-01-4,400124024,2020,2025-02-14,20230811-150005
4,400124119,CLVYL,1753,CHLORURE DE VINYL MONOMÈRE,Chlorure de vinyl monomère,,N,L,140,µg/L,133,<=0.5 µg/L,,1.4,75-01-4,400124183,2020,2025-02-14,20230811-150005
5,500110055,CLVYL,1753,CHLORURE DE VINYL MONOMÈRE,Chlorure de vinyl monomère,,N,L,79,µg/L,133,<=0.5 µg/L,,0.79,75-01-4,500117171,2020,2025-02-14,20230811-150005
5,500112175,CLVYL,1753,CHLORURE DE VINYL MONOMÈRE,Chlorure de vinyl monomère,,N,L,2575,µg/L,133,<=0.5 µg/L,,2.575,75-01-4,500119367,2020,2025-02-14,20230811-150005
5,500112309,CLVYL,1753,CHLORURE DE VINYL MONOMÈRE,Chlorure de vinyl monomère,,N,L,1396,µg/L,133,<=0.5 µg/L,,1.396,75-01-4,500119512,2020,2025-02-14,20230811-150005
6,600221382,CLVYL,1753,CHLORURE DE VINYL MONOMÈRE,Chlorure de vinyl monomère,,N,L,17,µg/L,133,<=0.5 µg/L,,1.7,75-01-4,600221398,2020,2025-02-14,20230811-150005


In [7]:
%%sql

with "resultats_cvm_non_conformes" as (
    select *
    from "edc_resultats"
    where cdparametresiseeaux = 'CLVYL' and valtraduite > 0.5
),
"prelevements_cvm_non_conformes_par_annee_et_cdreseau" as (
    select
        "cdreseau",
        "resultats_cvm_non_conformes"."de_partition",
        count(*) as "count_prelevements_non_conformes",
        string_agg("resultats_cvm_non_conformes"."referenceprel") as "list_referenceprels",
        string_agg("valtraduite") as "list_valtraduite"
    from "resultats_cvm_non_conformes"
    left join "edc_prelevements" on
        "edc_prelevements"."referenceprel" = "resultats_cvm_non_conformes"."referenceprel"
        and
        "edc_prelevements"."de_partition" = "resultats_cvm_non_conformes"."de_partition"
    group by "cdreseau", "resultats_cvm_non_conformes"."de_partition"
)
select * from "prelevements_cvm_non_conformes_par_annee_et_cdreseau"

cdreseau,de_partition,count_prelevements_non_conformes,list_referenceprels,list_valtraduite
87000053,2021,2,0870011137308700111374,"0.88,0.87"
87001148,2021,1,08700111174,0.57
87001426,2021,2,0870010968408700110502,"0.54,0.67"
87001433,2021,3,087001087650870011106708700109784,"0.63,0.56,1.1"
87001541,2021,2,0870010970108700110621,"2.6,3.4"
87003627,2021,2,0870010995908700111085,"1.1,0.75"
32003922,2022,1,03200089345,6.6
53000149,2022,1,05300115885,0.97
87000403,2021,1,08700109786,0.52
87000420,2021,7,08700107649087001086710870010867208700110240087001102800870011105308700109904,"0.98,0.95,1.8,1.2,1.1,1.1,1.1"


In [8]:
%%sql

with "resultats_cvm_non_conformes" as (
    select *
    from "edc_resultats"
    where cdparametresiseeaux = 'CLVYL' and valtraduite > 0.5
),
"prelevements_cvm_non_conformes_par_annee_et_cdreseau" as (
    select
        "cdreseau",
        "resultats_cvm_non_conformes"."de_partition",
        count(*) as "count_prelevements_non_conformes",
        string_agg("resultats_cvm_non_conformes"."referenceprel") as "list_referenceprels",
        string_agg("valtraduite") as "list_valtraduite"
    from "resultats_cvm_non_conformes"
    left join "edc_prelevements" on
        "edc_prelevements"."referenceprel" = "resultats_cvm_non_conformes"."referenceprel"
        and
        "edc_prelevements"."de_partition" = "resultats_cvm_non_conformes"."de_partition"
    group by "cdreseau", "resultats_cvm_non_conformes"."de_partition"
),
"communes_count_prelevements_cvm_non_conformes_par_annee" as (
    select
        "inseecommune",
        "edc_communes"."de_partition",
        count(distinct "edc_communes"."cdreseau") as "nbr_cdreseau",
        coalesce(sum(count_prelevements_non_conformes), 0) as "count_prelevements_non_conformes"
    from "edc_communes"
    left join "prelevements_cvm_non_conformes_par_annee_et_cdreseau" on
        "prelevements_cvm_non_conformes_par_annee_et_cdreseau"."cdreseau" = "edc_communes"."cdreseau"
        and
        "prelevements_cvm_non_conformes_par_annee_et_cdreseau"."de_partition" = "edc_communes"."de_partition"
    group by "inseecommune", "edc_communes"."de_partition"
)
select * from communes_count_prelevements_cvm_non_conformes_par_annee


inseecommune,de_partition,nbr_cdreseau,count_prelevements_non_conformes
88495,2024,1,0
88497,2024,1,0
88505,2024,1,0
88509,2024,1,0
89002,2024,1,0
89005,2024,2,0
89009,2024,1,0
89014,2024,1,0
89018,2024,1,0
89023,2024,1,0


In [9]:
%%sql

with "resultats_cvm_non_conformes" as (
    select *
    from "edc_resultats"
    where cdparametresiseeaux = 'CLVYL' and valtraduite > 0.5
),
"prelevements_cvm_non_conformes_par_annee_et_cdreseau" as (
    select
        "cdreseau",
        "resultats_cvm_non_conformes"."de_partition",
        count(*) as "count_prelevements_non_conformes",
        string_agg("resultats_cvm_non_conformes"."referenceprel") as "list_referenceprels",
        string_agg("valtraduite") as "list_valtraduite"
    from "resultats_cvm_non_conformes"
    left join "edc_prelevements" on
        "edc_prelevements"."referenceprel" = "resultats_cvm_non_conformes"."referenceprel"
        and
        "edc_prelevements"."de_partition" = "resultats_cvm_non_conformes"."de_partition"
    group by "cdreseau", "resultats_cvm_non_conformes"."de_partition"
),
"communes_count_prelevements_cvm_non_conformes_par_annee" as (
    select
        "inseecommune",
        "edc_communes"."de_partition",
        count(distinct "edc_communes"."cdreseau") as "nbr_cdreseau",
        coalesce(sum(count_prelevements_non_conformes), 0) as "count_prelevements_non_conformes"
    from "edc_communes"
    left join "prelevements_cvm_non_conformes_par_annee_et_cdreseau" on
        "prelevements_cvm_non_conformes_par_annee_et_cdreseau"."cdreseau" = "edc_communes"."cdreseau"
        and
        "prelevements_cvm_non_conformes_par_annee_et_cdreseau"."de_partition" = "edc_communes"."de_partition"
    group by "inseecommune", "edc_communes"."de_partition"
),
"annees" as (SELECT unnest(generate_series(2020, 2024)) as "annee")
select
    "cog"."COM" as "commune_code_insee",
    "cog"."LIBELLE" as "commune_nom",
    a."annee",
    coalesce("nbr_cdreseau", 0) as "nbr_cdreseau",
    coalesce("count_prelevements_non_conformes", 0) as "count_prelevements_non_conformes"
from read_csv("https://www.insee.fr/fr/statistiques/fichier/7766585/v_commune_2024.csv", header=true) as "cog"
cross join 
    "annees" a
left join "communes_count_prelevements_cvm_non_conformes_par_annee" on
   "cog"."COM" = "communes_count_prelevements_cvm_non_conformes_par_annee"."inseecommune"
   and
   a."annee"::string =  "communes_count_prelevements_cvm_non_conformes_par_annee"."de_partition"

# pour tester une commune avec un prélèvement non conforme, ajouter :
# where "COM" = '12139'

commune_code_insee,commune_nom,annee,nbr_cdreseau,count_prelevements_non_conformes
1001,L'Abergement-Clémenciat,2020,1,0
1002,L'Abergement-de-Varey,2020,1,0
1004,Ambérieu-en-Bugey,2020,3,0
1005,Ambérieux-en-Dombes,2020,1,0
1006,Ambléon,2020,1,0
1007,Ambronay,2020,1,0
1008,Ambutrix,2020,2,0
1009,Andert-et-Condon,2020,1,0
1010,Anglefort,2020,2,0
1011,Apremont,2020,1,0
