# Calcul du nombre de prélèvements CVM non conforme par commune et par année

L'objectif de ce notebook est de partir de la liste de communes cog_communes, et pour chaque commune et chaque année, calculer le nombre de prélèvements non conformes pour le CVM.

Il y aura plusieurs aggrégations à faire :

- commune (inseecommune) peut avoir plusieurs UDIs (cdreseau) **ET** un UDI peut avoir plusieurs communes (inseecommune) 
- un prélèvement (referenceprel) peut être rattaché à plusieurs UDIs (cdreseau)
- un prélèvement (referenceprel) peut être composé de plusieurs paramètres (cdparametresiseeaux) ; mais dans le cas du CVM, il y a un seul paramètre selon la catégorisation de Pauline, donc c'est plus simple




In [1]:
%load_ext sql
%sql duckdb:///../../database/data.duckdb
%config SqlMagic.displaylimit = 10

In [2]:
%%sql
SELECT * FROM int__resultats_udi_communes
LIMIT 5

FloatProgress(value=0.0, layout=Layout(width='auto'), style=ProgressStyle(bar_color='black'))

referenceprel,cdparametresiseeaux,valtraduite,limitequal,de_partition,limitequal_float,unite,categorie,cdreseau,inseecommune,datetimeprel
400121459,CHINE,0.0,"<=0,1 µg/L",2020,0.1000000014901161,µg/L,pesticides,4000129,4058,2020-04-09 11:49:00
400121459,CHINOME,0.0,"<=0,1 µg/L",2020,0.1000000014901161,µg/L,pesticides,4000129,4058,2020-04-09 11:49:00
400121459,CHLORB,0.0,"<=0,1 µg/L",2020,0.1000000014901161,µg/L,pesticides,4000129,4058,2020-04-09 11:49:00
400121459,CHLPM,0.0,"<=0,1 µg/L",2020,0.1000000014901161,µg/L,pesticides,4000129,4058,2020-04-09 11:49:00
400121459,CHLX,0.0,"<=0,1 µg/L",2020,0.1000000014901161,µg/L,pesticides,4000129,4058,2020-04-09 11:49:00


## Faire la liste complètes des communes 

In [3]:
%%sql --save list_communes
 
SELECT DISTINCT
    inseecommune 
 FROM
      int__lien_commune_cdreseau

inseecommune
53226
53273
54011
54020
54053
54070
54072
54073
54089
54091


## Test cog pour le final

In [4]:
%%sql 
SELECT 
    *
FROM 
  cog_communes
WHERE
    TYPECOM = 'COM'

TYPECOM,COM,REG,DEP,CTCD,ARR,TNCC,NCC,NCCENR,LIBELLE,CAN,COMPARENT,de_partition,de_ingestion_date,de_dataset_datetime
COM,1001,84,1,01D,12,5,ABERGEMENT CLEMENCIAT,Abergement-Clémenciat,L'Abergement-Clémenciat,108,,2024,2025-03-16,20240220
COM,1002,84,1,01D,11,5,ABERGEMENT DE VAREY,Abergement-de-Varey,L'Abergement-de-Varey,101,,2024,2025-03-16,20240220
COM,1004,84,1,01D,11,1,AMBERIEU EN BUGEY,Ambérieu-en-Bugey,Ambérieu-en-Bugey,101,,2024,2025-03-16,20240220
COM,1005,84,1,01D,12,1,AMBERIEUX EN DOMBES,Ambérieux-en-Dombes,Ambérieux-en-Dombes,122,,2024,2025-03-16,20240220
COM,1006,84,1,01D,11,1,AMBLEON,Ambléon,Ambléon,104,,2024,2025-03-16,20240220
COM,1007,84,1,01D,11,1,AMBRONAY,Ambronay,Ambronay,101,,2024,2025-03-16,20240220
COM,1008,84,1,01D,11,1,AMBUTRIX,Ambutrix,Ambutrix,101,,2024,2025-03-16,20240220
COM,1009,84,1,01D,11,1,ANDERT ET CONDON,Andert-et-Condon,Andert-et-Condon,104,,2024,2025-03-16,20240220
COM,1010,84,1,01D,11,1,ANGLEFORT,Anglefort,Anglefort,110,,2024,2025-03-16,20240220
COM,1011,84,1,01D,14,1,APREMONT,Apremont,Apremont,114,,2024,2025-03-16,20240220


## Les résultats par communes - Last prelevement 

###  SQL resultats_ALL_communes : Join avec list_communes_uid pour avoir la liste complète

###  Join avec cog pour avoir le nom des communes

# Final : ana__resultats_communes_last

In [2]:
%%sql 
WITH 
/* list_communes_uid  */
list_communes_uid AS (    
SELECT DISTINCT
    inseecommune 
 FROM
      int__lien_commune_cdreseau
),
/* END  list_communes_uid  */


/* communes_LAST_PVL */
 LAST_PVL AS (
    SELECT 
     *,
     ROW_NUMBER() OVER (PARTITION BY inseecommune, cdparametresiseeaux ORDER BY datetimeprel DESC ) As row_number
    FROM
      int__resultats_udi_communes
    WHERE 
        categorie= 'cvm' -- à supprimer pour avoir pour tout
    ),

communes_LAST_PVL AS (     
    SELECT 
     LAST_PVL.*  EXCLUDE (row_number)
    FROM
      LAST_PVL 
    WHERE
      row_number = 1
    ),
/* communes_LAST_PVL END */

    
resultats_all_communes_last AS ( 
    SELECT
        *
    FROM  
     list_communes_uid
    LEFT JOIN 
     communes_LAST_PVL
    ON
        list_communes_uid.inseecommune  =  communes_LAST_PVL.inseecommune
),

cog AS (
    SELECT 
      DEP AS code_departement,
      REG AS code_region,
      COM AS inseecommune,
      LIBELLE AS commune_nom
    FROM 
      cog_communes
    WHERE
        TYPECOM = 'COM'
)

SELECT
    'dernier prelevement' AS periode,
    cog.commune_nom,
    resultats_all_communes_last.*
FROM
  resultats_all_communes_last
LEFT JOIN  
  cog
ON 
  resultats_all_communes_last.inseecommune = cog.inseecommune


FloatProgress(value=0.0, layout=Layout(width='auto'), style=ProgressStyle(bar_color='black'))

periode,commune_nom,inseecommune,referenceprel,cdparametresiseeaux,valtraduite,limitequal,de_partition,limitequal_float,unite,categorie,cdreseau,inseecommune_1,datetimeprel
dernier prelevement,Xertigny,88530,8800185399,CLVYL,0.0,<=0.5 µg/L,2024,0.5,µg/L,cvm,88001440,88530,2024-09-27 12:00:00
dernier prelevement,Montholon,89003,8900131165,CLVYL,0.0,<=0.5 µg/L,2024,0.5,µg/L,cvm,89003823,89003,2024-06-26 10:22:00
dernier prelevement,Annay-la-Côte,89009,8900128872,CLVYL,0.004,<=0.5 µg/L,2023,0.5,µg/L,cvm,89000433,89009,2023-12-18 09:25:00
dernier prelevement,Annoux,89012,8900130376,CLVYL,0.005,<=0.5 µg/L,2024,0.5,µg/L,cvm,89000714,89012,2024-04-16 10:48:00
dernier prelevement,Arcy-sur-Cure,89015,8900132364,CLVYL,0.01,<=0.5 µg/L,2024,0.5,µg/L,cvm,89000434,89015,2024-10-04 09:13:00
dernier prelevement,Asnières-sous-Bois,89020,8900131810,CLVYL,0.0,<=0.5 µg/L,2024,0.5,µg/L,cvm,89000693,89020,2024-08-21 09:23:00
dernier prelevement,Baon,89028,8900133222,CLVYL,0.0,<=0.5 µg/L,2024,0.5,µg/L,cvm,89000443,89028,2024-12-17 09:58:00
dernier prelevement,Bernouil,89038,8900130521,CLVYL,0.0,<=0.5 µg/L,2024,0.5,µg/L,cvm,89000725,89038,2024-05-06 11:28:00
dernier prelevement,Les Bordes,89051,8900133341,CLVYL,0.005,<=0.5 µg/L,2024,0.5,µg/L,cvm,89000721,89051,2024-12-11 09:11:00
dernier prelevement,La Celle-Saint-Cyr,89063,8900133394,CLVYL,0.0,<=0.5 µg/L,2024,0.5,µg/L,cvm,89000751,89063,2024-12-12 08:24:00
