In [3]:
import numpy as np
import glob
import xarray as xr 
import matplotlib.pyplot as plt 
import matplotlib.patches as mpatches
import matplotlib.lines as mlines
import matplotlib
import pandas as pd
import time
import glob
import sys, os
import string

sys.path.insert(0, os.path.abspath('./lib'))

from lib import hss,precision #,far,f1, pod,pofd
from lib import create_combination_subzones, create_nc_mask_NSEO
from lib import find_neighbours, group_masks_size, select_group_mask, get_WME_legend, get_not_included_masks

import stageemi
import stageemi.dev.distance_wwmf as distance_wwmf

In [4]:
def get_optimal_subzone_v2(ds_WME, groupe_mask_select,cible):
    """
        ds_WME  = xarray contenant les champs WME
        cible = valeur du temps sensible cible (par exemple code WME)
        groupe_mask_select = ensemble de masks qui vont être comparés à l'objet météo
        ds_mask = La liste de masques
    """
    score_precision = np.zeros(len(groupe_mask_select.mask))    
    score_hss       = np.zeros(len(groupe_mask_select.mask)) 

    for imask,ds_mask_sub in enumerate(groupe_mask_select.mask):    
        # check if latitudes are aranged in the the same way
        lat1 = ds_mask_sub.latitude.values
        lat2 = ds_WME.latitude.values
        if (np.sum(lat1==lat2) == lat1.size ): 
            # same order 
            y_true = ds_WME.wme_arr.copy()
        elif (np.sum(lat1[::-1]==lat2)== lat1.size):
            # reverse order
            y_true = ds_WME.wme_arr[::-1,:].copy()
        else: 
            print("pb sur lon/lat")
            break
        y_pred = ds_mask_sub.copy() 
        # binarise
        y_true = y_true.where(~((y_true.values!=cible) & (~np.isnan(y_true.values))),0)#ds_dep.wme_arr.copy()
        y_true = y_true.where(~(y_true.values == cible), 1)
        y_true_score = y_true.values[~np.isnan(y_true.values)]
        y_pred_score = y_pred.values[~np.isnan(y_pred.values)]
    #     print(y_true_score,y_pred_score )
        # metriques : 
        score_precision[imask] = precision(y_true_score,y_pred_score)
        score_hss[imask]       = hss(y_true_score,y_pred_score)

    ind_nan = np.where((~np.isnan(score_hss))*(score_hss>0))

    # car si hss <0, alors le hasard fait mieux les choses
    if np.size(ind_nan[0])== 0 :
        # signifie qu'il y a aucune zone qui représente bien la cible
        print('pas de zones homogène pour {}'.format(cible))
        zones_optimales_f,hss_f,precision_f = [],[],[] 
    elif np.size(ind_nan[0])== 1 : 
        # une seule zone possible
        zones_optimales_f = [groupe_mask_select.id.values[ind_nan][0]]
        hss_f             = [score_hss[ind_nan][0]]
        precision_f       = [score_precision[ind_nan][0]]

    else: 

        # selection de la zone qui maximise le hss
        indice = np.argmax(score_hss[ind_nan]) 
        zones_optimales_f = [groupe_mask_select.id.values[ind_nan][indice]]
        hss_f             = [score_hss[ind_nan][indice]]
        precision_f       = [score_precision[ind_nan][indice]] 
        mask_ref          =  groupe_mask_select.sel(id=zones_optimales_f[0]).mask
        # on cherche les zones non-incluses dans cette zone pour aller chercher le deuxième meilleur hss
        lst_mask_not_included, lst_mask_included = get_not_included_masks(mask_ref, groupe_mask_select.id.values[ind_nan],
                                                    groupe_mask_select,flag_strictly_included=False)
        print(zones_optimales_f[0],lst_mask_not_included)
        if(len(lst_mask_not_included)>0):
            score_hss2 = [score_hss[ind_nan][groupe_mask_select.id.values[ind_nan] == mask_id] for mask_id in lst_mask_not_included]
            score_precision2 = [score_precision[ind_nan][groupe_mask_select.id.values[ind_nan] == mask_id] for mask_id in lst_mask_not_included]
            list_mask2 = [groupe_mask_select.id.values[ind_nan][groupe_mask_select.id.values[ind_nan] == mask_id] for mask_id in lst_mask_not_included]
            indice2 = np.argmax(score_hss2)    
            if score_precision2[indice2]>0.2 and \
                np.abs(score_hss[ind_nan][indice] - score_hss2[indice2]) / score_hss[ind_nan][indice] <0.2:
                zones_optimales_f.append(list_mask2[indice2].tolist()[0]) #groupe_mask_select.id.values[ind_nan][indice2])
                hss_f.append(score_hss2[indice2])
                precision_f.append(score_precision2[indice2] )
    return zones_optimales_f,hss_f,precision_f

In [3]:
matplotlib.rcParams['legend.handlelength'] = 0
matplotlib.rcParams['legend.numpoints'] = 1

In [8]:
# On obtient un zonage par departement par echeance.

''' input '''
date = '2020012600' # Date pour laquelle on fait tourner 
# date = '2020030600'
list_method_distance = ['compas']#,'agat','compas_asym','agat_asym'] # pour agreger le temps sensible

mask_sympo = False # Veut-on des combie de zones sympos ? 
mask_geographique = True # Veut-on des combinaisons Est/Ouest/Nord/Sud. A rebrancher. 
mask_sympo = True # Veut-on des combie de zones sympos ? 
mask_geographique = False # Veut-on des combinaisons Est/Ouest/Nord/Sud. A rebrancher. 


dir_fig = '../figures/total/' 
nsubzonesMax = 4 # Nombre de sous zones 
plot_results = False
Force = False # Force to recompute staff 
if date == '2020012600':
#     echeance_dict = {
#         '38':[44,12,3,46,43,25,30],
#         '29':[32,39,20,33,13],  
#         '34':[1,5,6,4 ,10, 20,30], 
#         '41':[45,4,44,5,20,30]
#     }
        echeance_dict = {
#             '38':[44,43,3,46,30],
#             '41':[45,4]#,44,5,20,30]
            '29':[32]
    }
elif date == '2020030600':
    echeance_dict = {
        '38':[29,3,1,4,36],
        '41':[18],
        '29':[1,5,3],  
        '34':[31,6,16,29,30], 
    }
    
for dep_id in echeance_dict.keys():
    echeance_list = echeance_dict[dep_id]
    print('dep_id',dep_id)
    ''' lecture fichier arome '''
    fname = "../WWMF/" + date+'0000__PG0PAROME__'+'WWMF'+'__EURW1S100______GRILLE____0_48_1__SOL____GRIB2.nc'
    ds = xr.open_dataset(fname,chunks={"step":1}).isel(step = echeance_list)
    # Arrondi pour éviter les erreurs     
    ds['latitude']  = ds['latitude'].round(5)
    ds['longitude'] = ds['longitude'].round(5)
    if date == '2020030600':
        ds = ds.rename({'paramId_0':'unknown'})
    

        
    ''' lecture du mask '''
    if mask_sympo and not mask_geographique:         
        fname_out = '../GeoData/zones_sympo_multiples/'+dep_id+'_mask_zones_sympos.nc'
        if not os.path.exists(fname_out): 
            # Creation du fichier (netcdf) de combinaison des zones sympos 
            dir_mask = '/home/mrpa/borderiesm/stageEMI/Codes/StageEMI/Masques_netcdf/ZONE_SYMPO/'
            list_subzones = glob.glob(dir_mask + dep_id +'*.nc')
            n_subzones = len(list_subzones)  # nombre de zones sympos initiales
            lst_subzones = [zone[-7:-3] for zone in list_subzones]
            ds_mask = create_combination_subzones(dir_mask,dep_id,lst_subzones,fname_out,degre5=True) 
            ds_mask = ds_mask.chunk({"id":1}) # Rend le calcul parallele possible 
        else: 
            # Le fichier est disponible 
            ds_mask = xr.open_dataset(fname_out,chunks={"id":1})
        dir_out = '../zonageWME/v7_'+'WME_' # repertoire contenant les fichiers résultats du zonage
        id_dep = 'departement' # identifiant de la zone recouvrant tout le departement
    if mask_geographique and not mask_sympo: 
        if   dep_id == '38': dep = 'FRK24'
        elif dep_id == '41': dep = 'FRB05'
        elif dep_id == "34": dep = 'FRJ13'
        elif dep_id == '29': dep = "FRH02"
        else: 
            print('remplir la bonne valeur pour le dep')
            sys.exit()
        fname_out = '../GeoData/zones_sympo_multiples/'+ dep_id+'_'+dep+'_mask_NSEO.nc'
        if not os.path.exists(fname_out):
            # Creation du fichier (netcdf) s'il n'existe pas 
            dir_mask  = '../GeoData/nc_departement/'
            dep_file  = dir_mask + dep +'.nc' 
            print('on cree',fname_out)
            ds_mask = create_nc_mask_NSEO(dep_file,fname_out,plot_dep=False)
            ds_mask = ds_mask.chunk({"id":1})
        else:
            ds_mask = xr.open_dataset(fname_out,chunks={"id":1})
        dir_out = '../zonageWME/v7_'+'geo_' # repertoire contenant les fichiers résultats du zonage
        id_dep = '0+1+2+3+4+5+6+7+8'# identifiant de la zone recouvrant tout le departement
    sys.exit()    
    # Arrondi pour éviter les erreurs         
    ds_mask["latitude"]  = ds_mask["latitude"].round(5)
    ds_mask["longitude"] = ds_mask["longitude"].round(5)
    ds_dep_tot = (ds*ds_mask.mask.sel(id=id_dep))
   
    ''' calcul des temps agrégés '''
    ds_distance_dict = {}
    for name in list_method_distance:
        ds_distance         = distance_wwmf.get_pixel_distance_dept(ds_dep_tot,name) # rajoute les variables wme_arr et w1_arr
        ds_distance_chunk   = ds_distance.chunk({"step":1}) 
        # On recupere ici toute les zones. 
        ds_distance_dict[name] = (ds_distance_chunk * ds_mask.mask).sum(['latitude',"longitude"]).compute()
    print('fin calcul distance')
   
    # On part toujours sur l'utilisation des dénominations COMPAS car elles sont moins nombreuses?  
    var_name = 'wme_arr'
    for icheance,echeance in enumerate(echeance_list): 
        print(echeance)
        fname_out = dir_out+dep_id+'_'+date+'_'+str(echeance)+'.csv'

        if os.path.exists(fname_out) and not Force:
            print(fname_out,'existe')
            continue
        
        tdeb = time.time()
        ''' on restreint la liste des WME pour le zonage '''
        ds_dep = ds_dep_tot.isel(step = icheance).copy()
        # on regroupe 'Très nuageux/Couvert' et 'Nuageux'
        ds_dep = ds_dep.where(~((ds_dep[var_name].values == 2) + (ds_dep[var_name].values == 3) ), 2)
        # on regroupe ensemble neige (10) et neige faible (7)
        ds_dep = ds_dep.where(~((ds_dep[var_name].values == 7) + (ds_dep[var_name].values == 10)), 10)
        # on regroupe ensemble pluie (8) et pluie faible (6)
        ds_dep = ds_dep.where(~((ds_dep[var_name].values == 8) + (ds_dep[var_name].values == 6)),8)
        # on regroupe ensemble qlqs averses (12) et averses (14), et qlqs averses de neige (13)
        ds_dep = ds_dep.where(~((ds_dep[var_name].values == 12) + (ds_dep[var_name].values == 13)
                                  + (ds_dep[var_name].values == 14 )),14)
        # on regroupe ensemble averses Orageuses (16) et Orages  (18)
        ds_dep = ds_dep.where(~((ds_dep[var_name].values == 16) + (ds_dep[var_name].values == 18)),18)

        file_CodesWWMF = '../utils/CodesWWMF.csv'
        cible_list,legend_list = get_WME_legend(file_CodesWWMF, ds_dep) 

        ''' zonage '''
        listCible    = cible_list[::-1] # On considère que l'ordre inverse est l'ordre de criticité maximun.
                                        # A bien définir lors de l'utilisation selon les cas.  

        legend_cible = [] # pour stocker la légende du code WME
        listMasksNew = ds_mask.id.values # on commence avec l'ensemble des masks

        # liste de zones sympos initiales (pour checker à la fin si on a une info sur toutes les zones du département)
        list_zones_sympos_initiales = [zone for zone in ds_mask.id.values if (('+' not in zone) and (zone!='departement'))]
        
        nsubzones    = 0
        zones_cibles = {}
        score_zones_cibles = {}
        if len(listCible) == 0 : # si un département a le même temps sensible partout
            zones_cibles[listCible[0]] = 'departement'
        else: 
            for icible,cible in enumerate(listCible):
                if nsubzones > nsubzonesMax: 
                    print('nombre de sous-zones trop grand')
                    break 
                if nsubzones >1: 
                    # pour éviter que departement ne soit selectionné alors que des sous-zones de departement aient déjà été selectionnées.
                    listMasksNew = [element for element in listMasksNew if element !=id_dep ]

                if len(listMasksNew)>60:
                    #  on regroupe les masks selon leur taille pour aller plus vite 
                    groupe1,groupe2,groupe3,taille1,taille2  = group_masks_size(listMasksNew,ds_mask)
                    # on selectionne le groupement de zones qui match l'objet météo
                    groupe_mask_select = select_group_mask(ds_dep,cible,groupe1,groupe2,groupe3,taille1,taille2)
                else: 
                    # on considère l'ensemble des masks
                    groupe_mask_select = ds_mask.sel(id=listMasksNew) 
                # on selectionne la zone optimale (selon le hss et la précision)
                zones_optimales,score_hss,score_precision=get_optimal_subzone_v2(ds_dep, groupe_mask_select,cible)              
                if len(zones_optimales)!=0:
                    legend_cible.append(legend_list[::-1][icible])
                    score_zones_cibles[cible] = score_hss
                    zones_cibles[cible] = zones_optimales 
                    nsubzones +=1 
                    # sinon pas de zones selectionnées                                            
                    ''' on check que la somme des zones n'est pas déjà égale au departement '''
                    if  (nsubzones== 1) and (len(zones_cibles[cible]) == 1) :
                        ds_temp  = ds_mask.sel(id=zones_cibles[cible][0]).mask.copy()

                    elif (nsubzones== 1) and (len(zones_cibles[cible]) > 1): 
    #                    ds_temp  = ds_mask.sel(id=zones_cibles[cible]).mask.sum("id") >= 1  
                        ds_temp  = ds_mask.sel(id=zones_cibles[cible][0]).mask.copy() 
                        ds_temp.values[(ds_temp.values == 1) + (ds_mask.sel(id=zones_cibles[cible][1]).mask.values ==1) ] = 1
                    else: 
                        for zone in zones_cibles[cible]:                            
                            ds_temp.values[(ds_temp.values == 1) + (ds_mask.sel(id=zone).mask.values ==1) ] = 1

                    somme = np.sum((ds_temp.values == 1)&( ds_mask.sel(id=id_dep).mask.values== 1))
                    tailleDep = np.sum( ds_mask.sel(id=id_dep).mask.values== 1)
                    if somme == tailleDep: 
                        print('on a atteint la taille du departement')
                        break
                    # on récupère les zones non-incluses dans la zone sélectionnée
                    for zone in zones_cibles[cible]:
                        listMasksNew, lst_mask_included = get_not_included_masks(ds_mask.mask.sel(id=zone)
                                                        ,listMasksNew,ds_mask,flag_strictly_included=False)
            # fin boucle sur cible
            ''' on vérifie que toutes les zones du département sont dans les zones selectionnées '''
            list_zones_select = sum([zones_cibles[cible] for cible in zones_cibles.keys()],[]) 
            zones_restantes = []
            for zone_sympo in list_zones_sympos_initiales:
                n = 0
                for zone_select in list_zones_select: 
                    if zone_sympo in zone_select:
                        n+=1
                if n == 0 : 
                    zones_restantes.append(zone_sympo)
        
        print(zones_cibles)   
        print(zones_restantes)
        
        '''save results in csv'''
        print('saving results')
        
        d = { 'zone':sum([zones_cibles[cible] for cible in zones_cibles.keys()],[]), 
            'cible_wme':sum([[cible]  if len(zones_cibles[cible])==1 else [cible,cible] for cible in zones_cibles.keys()],[]),
            'hss' : sum([score_zones_cibles[cible] for cible in zones_cibles.keys()],[])}

        if len(zones_restantes)>0:
            d['zone'] += zones_restantes
            d['hss'] += [np.nan for i in range(len(zones_restantes))]
            d['cible_wme'] += [np.nan for i in range(len(zones_restantes))]
        for name in list_method_distance:
            d[name] =  ds_distance_dict[name].wwmf_2[ds_distance_dict[name].argmin("wwmf_2")].sel(id=d['zone']).isel(step=icheance).values
        pd.DataFrame(data=d).to_csv(fname_out)
        print('temps %s \n'%(time.time()-tdeb))




dep_id 29


SystemExit: 

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


In [16]:
listMasksNew = ds_mask.id.values

listMasksNew, lst_mask_included = get_not_included_masks(ds_mask.mask.sel(id='3801+3802')
                                                        ,listMasksNew,ds_mask,flag_strictly_included=False)


ds_WME = ds_dep.copy()
cible = 14

score_precision = np.zeros(len(groupe_mask_select.mask))    
score_hss       = np.zeros(len(groupe_mask_select.mask)) 

for imask,ds_mask_sub in enumerate(groupe_mask_select.mask):    
    # check if latitudes are aranged in the the same way
    lat1 = ds_mask_sub.latitude.values
    lat2 = ds_WME.latitude.values
    if (np.sum(lat1==lat2) == lat1.size ): 
        # same order 
        y_true = ds_WME.wme_arr.copy()
    elif (np.sum(lat1[::-1]==lat2)== lat1.size):
        # reverse order
        y_true = ds_WME.wme_arr[::-1,:].copy()
    else: 
        print("pb sur lon/lat")
        break
    y_pred = ds_mask_sub.copy() 
    # binarise
    y_true = y_true.where(~((y_true.values!=cible) & (~np.isnan(y_true.values))),0)#ds_dep.wme_arr.copy()
    y_true = y_true.where(~(y_true.values == cible), 1)
    y_true_score = y_true.values[~np.isnan(y_true.values)]
    y_pred_score = y_pred.values[~np.isnan(y_pred.values)]
    # metriques : 
    score_precision[imask] = precision(y_true_score,y_pred_score)
    score_hss[imask]       = hss(y_true_score,y_pred_score)

ind_nan = np.where((~np.isnan(score_hss))*(score_hss>0))

# car si hss <0, alors le hasard fait mieux les choses
if np.size(ind_nan[0])== 0 :
    # signifie qu'il y a aucune zone qui représente bien la cible
    print('pas de zones homogène pour {}'.format(cible))
    zones_optimales_f,hss_f,precision_f = [],[],[] 
elif np.size(ind_nan[0])== 1 : 
    # une seule zone possible
    zones_optimales_f = [groupe_mask_select.id.values[ind_nan][0]]
    hss_f             = [score_hss[ind_nan][0]]
    precision_f       = [score_precision[ind_nan][0]]

else: 

    # selection de la zone qui maximise le hss
    indice = np.argmax(score_hss[ind_nan]) 
    zones_optimales_f = [groupe_mask_select.id.values[ind_nan][indice]]
    hss_f             = [score_hss[ind_nan][indice]]
    precision_f       = [score_precision[ind_nan][indice]] 
    mask_ref          =  groupe_mask_select.sel(id=zones_optimales_f[0]).mask
    # on cherche les zones non-incluses dans cette zone pour aller chercher le deuxième meilleur hss
    lst_mask_not_included, lst_mask_included = get_not_included_masks(mask_ref, groupe_mask_select.id.values[ind_nan],
                                                groupe_mask_select,flag_strictly_included=False)
    print(zones_optimales_f[0],lst_mask_not_included)
    if(len(lst_mask_not_included)>0):
        indice2 = np.argmax([score_hss[ind_nan][groupe_mask_select.id.values[ind_nan] == mask_id] for mask_id in lst_mask_not_included])

        if score_precision[ind_nan][indice2]>0.2 and \
            np.abs(score_hss[ind_nan][indice] - score_hss[ind_nan][indice2]) / score_hss[ind_nan][indice] <0.2:
            zones_optimales_f.append(groupe_mask_select.id.values[ind_nan][indice2])
            print(zones_optimales_f,groupe_mask_select.id.values[ind_nan][indice],groupe_mask_select.id.values[ind_nan][indice2])
            hss_f.append(score_hss[ind_nan][indice2])
            precision_f  = [score_precision[ind_nan][indice2]] 
        else: 
            print(groupe_mask_select.id.values[ind_nan][indice2])
            print(score_hss[ind_nan][indice2])
            print(  np.abs(score_hss[ind_nan][indice] - score_hss[ind_nan][indice2]) / score_hss[ind_nan][indice] )


3805 ['3801', '3803', '3806', '3801+3802', '3801+3803', '3802+3803', '3803+3806', '3804+3806', '3806+3808', '3801+3802+3803', '3801+3802+3804', '3801+3803+3804', '3801+3803+3806', '3802+3803+3806', '3802+3804+3806', '3803+3804+3806', '3803+3806+3808', '3804+3806+3808', '3801+3803+3804+3808', '3801+3803+3806+3808', '3802+3803+3806+3808', '3802+3804+3806+3808', '3803+3804+3806+3808']
3801+3802+3803
0.09267086622461079
0.6535123596341857


In [None]:
sys.exit()
''' input '''
date = '2020012600'
# date = '2020030600'
list_name = ['compas'] #,'agat','compas_asym','agat_asym'] # pour agreger le temps sensible

mask_sympo = False
mask_geographique = True
dir_fig = '../figures/total/'
nsubzonesMax = 7
plot_results = True
if date == '2020012600':
#     echeance_dict = {
#         '38':[44,12,3,46,43,25,30],
#         '29':[32,39,20,33,13],  
#         '34':[1,5,6,4 ,10, 20,30], 
#         '41':[45,4,44,5,20,30]
#     }
        echeance_dict = {
        '41':[30]
    }
if date == '2020030600':
    echeance_dict = {
        '38':[29,3,1,4,36],
        '41':[18],
        '29':[1,5,3],  
        '34':[31,6,16,29,30], 
    }
    
for dep_id in echeance_dict.keys():
    echeance_list = echeance_dict[dep_id]
    print('dep_id',dep_id)
    ''' lecture du mask '''
    if mask_sympo and not mask_geographique: 
        fname_out = '../GeoData/zones_sympo_multiples/'+dep_id+'_mask_zones_sympos.nc'
        if not os.path.exists(fname_out): 
            dir_mask = '/home/mrpa/borderiesm/stageEMI/Codes/StageEMI/Masques_netcdf/ZONE_SYMPO/'
            list_subzones = glob.glob(dir_mask + dep_id +'*.nc')
            n_subzones = len(list_subzones)  # nombre de zones sympos initiales
            lst_subzones = [zone[-7:-3] for zone in list_subzones]
            ds_mask = create_combination_subzones(dir_mask,dep_id,lst_subzones,fname_out,degre5=True) 
            ds_mask = ds_mask.chunk({"id":1})
        else: 
            ds_mask = xr.open_dataset(fname_out,chunks={"id":1})

    if mask_geographique and not mask_sympo: 
        if   dep_id == '38': dep = 'FRK24'
        elif dep_id == '41': dep = 'FRB05'
        elif dep_id == "34": dep = 'FRJ13'
        elif dep_id == '29': dep = "FRH02"
        else: 
            print('remplir la bonne valeur pour le dep')
            sys.exit()
        fname_out = '../GeoData/zones_sympo_multiples/'+ dep_id+'_'+dep+'_mask_NSEO.nc'
        if not os.path.exists(fname_out):
            dir_mask  = '../GeoData/nc_departement/'
            dep_file  = dir_mask + dep +'.nc' 
            print('on cree',fname_out)
            ds_mask = create_nc_mask_NSEO(dep_file,fname_out,plot_dep=False)
            ds_mask = ds_mask.chunk({"id":1})
        else:
            ds_mask = xr.open_dataset(fname_out,chunks={"id":1})
            
    ds_mask["latitude"]  = ds_mask["latitude"].round(5)
    ds_mask["longitude"] = ds_mask["longitude"].round(5)
   
    ''' lecture arome '''
    fname = "../WWMF/" + date+'0000__PG0PAROME__'+'WWMF'+'__EURW1S100______GRILLE____0_48_1__SOL____GRIB2.nc'

    ds = xr.open_dataset(fname,chunks={"step":1}).isel(step = echeance_list)
    ds['latitude']  = ds['latitude'].round(5)
    ds['longitude'] = ds['longitude'].round(5)
    
    ds_dep_tot = (ds*ds_mask.mask.sel(id="departement").drop("id"))
#     ds_mask.sel(id= ds_mask.id[ds_mask.id_geo == 'departement'])
    if date == '2020030600':
        ds_dep_tot = ds_dep_tot.rename({'paramId_0':'unknown'})
        
    ''' calcul des temps agrégés '''
    ds_distance_dict = {}
    for name in list_name:
        ds_distance         = distance_wwmf.get_pixel_distance_dept(ds_dep_tot,name)
        ds_distance_chunk   = ds_distance.chunk({"step":1}) 
        ds_distance_dict[name] = (ds_distance_chunk * ds_mask.mask).sum(['latitude',"longitude"]).compute()
    print('fin calcul distance')
    
    var_name = 'wme_arr'
    for icheance,echeance in enumerate(echeance_list): 
        print(echeance)
        fname_out = '../zonageWME/geo'+dep_id+'_'+date+'_'+str(echeance)+'.csv'
        if os.path.exists(fname_out):
            print(fname_out,'existe')
            continue
        
        tdeb = time.time()
        ''' on restreint la liste des WME pour le zonage '''
        ds_dep = ds_dep_tot.isel(step = icheance).copy()
        # on regroupe 'Très nuageux/Couvert' et 'Nuageux'
        ds_dep = ds_dep.where(~((ds_dep[var_name].values == 2) + (ds_dep[var_name].values == 3) ), 2)

        # on regroupe ensemble neige (10) et neige faible (7)
        ds_dep = ds_dep.where(~((ds_dep[var_name].values == 7) + (ds_dep[var_name].values == 10)), 10)
        
        # on regroupe ensemble pluie (8) et pluie faible (6)
        ds_dep = ds_dep.where(~((ds_dep[var_name].values == 8) + (ds_dep[var_name].values == 6)),8)

        # on regroupe ensemble qlqs averses (12) et averses (14), et qlqs averses de neige (13)
        ds_dep = ds_dep.where(~((ds_dep[var_name].values == 12) + (ds_dep[var_name].values == 13)
                                  + (ds_dep[var_name].values == 14 )),14)

        # on regroupe ensemble averses Orageuses (16) et Orages  (18)
        ds_dep = ds_dep.where(~((ds_dep[var_name].values == 16) + (ds_dep[var_name].values == 18)),18)

        file_CodesWWMF = '../utils/CodesWWMF.csv'
        cible_list,legend_list = get_WME_legend(file_CodesWWMF, ds_dep)
        print(cible_list,legend_list)

        ''' zonage '''
        listCible    = cible_list[::-1]
        legend_cible = [] # pour stocker la légende du code WME
        listMasksNew = ds_mask.id.values # on commence avec l'ensemble des masks

        # liste de zones sympos initiales (pour checker à la fin si on a une info sur toutes les zones du département)
        list_zones_sympos_initiales = [zone for zone in ds_mask.id.values if '+' not in zone]
        print(list_zones_sympos_initiales)
        sys.exit()
        nsubzones    = 0
        zones_cibles = {}
        score_zones_cibles = {}
        if len(listCible) == 0 : # si un département a le même temps sensible partout
            zones_cibles[listCible[0]] = 'departement'
        else: 
            for icible,cible in enumerate(listCible):
                if nsubzones > nsubzonesMax: 
                    print('nombre de sous-zones trop grand')
                    break 
                if nsubzones >1: 
                    # pour éviter que departement ne soit selectionné alors que des sous-zones de departement aient déjà été selectionnées.
                    listMasksNew = [element for element in listMasksNew if element !='departement']

                if len(listMasksNew)>60:
                    #  on regroupe les masks selon leur taille pour aller plus vite 
                    groupe1,groupe2,groupe3,taille1,taille2  = group_masks_size(listMasksNew,ds_mask)
                    # on selectionne le groupement de zones qui match l'objet météo
                    groupe_mask_select = select_group_mask(ds_dep,cible,groupe1,groupe2,groupe3,taille1,taille2)
                else: 
                    # on considère l'ensemble des masks
                    groupe_mask_select = ds_mask.mask.sel(id=listMasksNew)
                # on selectionne la zone optimale (selon le hss et la précision)
                zones_optimales,score_hss,score_precision=get_optimal_subzone_v2(ds_dep, groupe_mask_select,cible,ds_mask)
                if len(zones_optimales)==0:
                    # pas de zone sélectionnée pour ce temps sensible
                    continue
                else: 
                    legend_cible.append(legend_list[::-1][icible])
                    score_zones_cibles[cible] = score_hss
                    zones_cibles[cible] = zones_optimales 
                    nsubzones +=1                          

                ''' on check que la somme des zones n'est pas déjà égale au departement '''
                if  (nsubzones== 1) and (len(zones_cibles[cible]) == 1) :
                    ds_temp  = ds_mask.sel(id=zones_cibles[cible][0]).mask.copy()

                elif (nsubzones== 1) and (len(zones_cibles[cible]) > 1): 
                    ds_temp  = ds_mask.sel(id=zones_cibles[cible][0]).mask.copy() 
                    ds_temp.values[(ds_temp.values == 1) + (ds_mask.sel(id=zones_cibles[cible][1]).mask.values ==1) ] = 1
                else: 
                    for zone in zones_cibles[cible]:
                        print(zone)
                        ds_temp.values[(ds_temp.values == 1) + (ds_mask.sel(id=zone).mask.values ==1) ] = 1

                somme = np.sum((ds_temp.values == 1)&( ds_mask.sel(id='departement').mask.values== 1))
                tailleDep = np.sum( ds_mask.sel(id='departement').mask.values== 1)
                if somme == tailleDep: 
                    print('on a atteint la taille du departement')
                    break
                # on récupère les zones non-incluses dans la zone sélectionnée
                for zone in zones_cibles[cible]:
                    listMasksNew, lst_mask_included = get_not_included_masks(ds_mask.mask.sel(id=zone)
                                                    ,listMasksNew,ds_mask,flag_strictly_included=False)
            # fin boucle sur cible
            ''' on vérifie que toutes les zones du département sont dans les zones selectionnées '''
            list_zones_select = sum([zones_cibles[cible] for cible in zones_cibles.keys()],[]) 
            zones_restantes = []
            for zone_sympo in list_zones_sympos_initiales:
                n = 0
                for zone_select in list_zones_select: 
                    if zone_sympo in zone_select:
                        n+=1
                if n == 0 : 
                    zones_restantes.append(zone_sympo)
        
        print(zones_cibles)          
        '''save results in csv'''
        print('saving results')
        
        d = { 'zone':sum([zones_cibles[cible] for cible in zones_cibles.keys()],[]), 
            'cible_wme':sum([[cible]  if len(zones_cibles[cible])==1 else [cible,cible] for cible in zones_cibles.keys()],[]),
            'hss' : sum([score_zones_cibles[cible] for cible in zones_cibles.keys()],[])}

        if len(zones_restantes)>0:
            d['zone'] += zones_restantes
            d['hss'] += [np.nan for i in range(len(zones_restantes))]
            d['cible_wme'] += [np.nan for i in range(len(zones_restantes))]
        for name in list_name:
            d[name] =  ds_distance_dict[name].wwmf_2[ds_distance_dict[name].argmin("wwmf_2")].sel(id=d['zone']).isel(step=icheance).values
        pd.DataFrame(data=d).to_csv(fname_out)
        
        ''' plot '''
        if not plot_results: 
            continue
        print('plot')
        X,Y = np.meshgrid( ds_mask.longitude.values,ds_mask.latitude.values)
        listMasks = [ds_mask.sel(id=id_ref) for id_ref in list_zones_sympos_initiales]

        legende = string.ascii_lowercase
        patches = []
        fig,axes = plt.subplots(nrows=1,ncols =3,figsize  = (15,5))
        ax = axes.flat

        fig.subplots_adjust(wspace=0.3)
        var2plot_lst = ['unknown','wme_arr','w1_arr']
        varmin_lst   = [0,1,0]
        varmax_lst   = [99,19,30]
        for iplot in range(3):
            var2plot = ds_dep_tot[var2plot_lst[iplot]].isel(step = icheance) 
            if iplot == 0 : 
                cmap  = matplotlib.cm.jet
            else: 
                cmap = matplotlib.cm.tab20b
                     
            varmin   = varmin_lst[iplot]
            varmax   = varmax_lst[iplot] + 1        
            clevs    = np.arange(varmin,varmax+1,1)
            cs       = var2plot.plot.imshow(ax = ax[iplot],cmap=cmap,levels=clevs)
            for icible,cible in enumerate(zones_cibles):
                for zone_select in  zones_cibles[cible] :
                    mask_ref = ds_mask.sel(id = zone_select)

                    list_neighbours = find_neighbours(mask_ref,listMasks)
                    lst_mask_not_included, lst_mask_included = get_not_included_masks(mask_ref.mask, list_neighbours,ds_mask,flag_strictly_included=True)
                    for neighbours in lst_mask_not_included:
                        ind = np.where((mask_ref.mask.values == 1) & (ds_mask.sel(id=neighbours).mask.values == 1))
                        ax[iplot].scatter(X[ind],Y[ind],color='k',s=6)
                    # 
                    # ajout de la legende
                    indice_mask_ref = np.where(mask_ref.mask.values == 1)

                    ax[iplot].text(X[indice_mask_ref].mean(),Y[indice_mask_ref].mean(),s=legende[icible],color='k',fontsize=15)
                    ax[iplot].set_title(date+' + {} h'.format(echeance))
                    if iplot ==0:
                        label = zone_select +': '+ legend_cible[icible] + ' ({})'.format(cible)
                        # ajout de l'agregation: 
                        for name in list_name: 
                            val_agrege = ds_distance_dict[name].wwmf_2[ds_distance_dict[name].argmin("wwmf_2")].sel(id=zone_select).isel(step=icheance).values
                            label += ' {}:{}'.format(name,val_agrege)
                if iplot == 0:
                    patches.append(mlines.Line2D([],[],label = label,marker='${}$'.format(legende[icible]),color='black'))
        lgd = ax[2].legend(handles=patches,bbox_to_anchor=(0.5,-0.2), loc='upper right',labelspacing =2,fontsize = 14)
        fig.tight_layout()
        fname_fig = dir_fig + 'v6_zonage_'+dep_id+date+'_'+str(echeance)+'.png'
        print(fname_fig)
        fig.savefig(fname_fig,dpi=400,bbox_inches='tight',format='png',bbox_extra_artists=(lgd,),)
        plt.clf()
        plt.close('all')
        print('temps',time.time()-tdeb)
    print()

