# Dotations : Analyse des évolutions 2020 et 2021

In [1]:
# Activate multi-output in notebook
# %matplotlib inline (pour des graphes)
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

## Parcours des données

### Chargement des données en mémoire

In [2]:
from os import getcwd
from pandas import DataFrame, read_csv


DATA_DIRECTORY = getcwd() + "/../data/"

# DGCL data
DATA_2020_PATH = DATA_DIRECTORY + "2020-communes-criteres-repartition.csv"
DATA_2021_PATH = DATA_DIRECTORY + "2021-communes-criteres-repartition.csv"

# Garanties DSU estimées
GARANTIES_DSU_PATH = DATA_DIRECTORY + "garanties_dsu.csv"

In [3]:
from scripts.load_dgcl_data import load_dgcl_file, adapt_dgcl_data

dgcl_data_2020 = load_dgcl_file(DATA_2020_PATH)
adapted_data_2020 = adapt_dgcl_data(dgcl_data_2020)

dgcl_data_2021 = load_dgcl_file(DATA_2021_PATH)
adapted_data_2021 = adapt_dgcl_data(dgcl_data_2021)


Loading /Users/sch/dev/gitruc/dotations-locales/data/2020-communes-criteres-repartition.csv


  This is separate from the ipykernel package so we can avoid doing imports until


Loading /Users/sch/dev/gitruc/dotations-locales/data/2021-communes-criteres-repartition.csv


  


In [4]:
# Colonnes des données brutes
len(dgcl_data_2021.keys())

195

In [5]:
# Colonnes des données adaptées 
# 34 colonnes en 2021
# n'incluent pas "dsu_montant_garantie_pluriannuelle"
adapted_data_2021.keys()

Index(['Informations générales - Code INSEE de la commune',
       'Informations générales - Nom de la commune', 'bureau_centralisateur',
       'chef_lieu_arrondissement', 'chef_lieu_de_canton',
       'chef_lieu_departement_dans_agglomeration', 'part_population_canton',
       'population_dgf', 'population_dgf_agglomeration',
       'population_dgf_departement_agglomeration', 'population_insee',
       'potentiel_financier', 'potentiel_financier_par_habitant',
       'revenu_total', 'strate_demographique', 'zrr', 'effort_fiscal',
       'longueur_voirie', 'zone_de_montagne', 'insulaire', 'superficie',
       'population_enfants', 'nombre_logements', 'nombre_logements_sociaux',
       'nombre_beneficiaires_aides_au_logement', 'population_qpv',
       'population_zfu', 'population_dgf_majoree',
       'recettes_reelles_fonctionnement', 'potentiel_fiscal',
       'population_dgf_maximum_commune_agglomeration', 'outre_mer',
       'population_dgf_chef_lieu_de_canton', 'revenu_par_habitan

In [6]:
adapted_data_2021

Unnamed: 0,Informations générales - Code INSEE de la commune,Informations générales - Nom de la commune,bureau_centralisateur,chef_lieu_arrondissement,chef_lieu_de_canton,chef_lieu_departement_dans_agglomeration,part_population_canton,population_dgf,population_dgf_agglomeration,population_dgf_departement_agglomeration,...,nombre_beneficiaires_aides_au_logement,population_qpv,population_zfu,population_dgf_majoree,recettes_reelles_fonctionnement,potentiel_fiscal,population_dgf_maximum_commune_agglomeration,outre_mer,population_dgf_chef_lieu_de_canton,revenu_par_habitant_moyen
0,01001,ABERGEMENT-CLEMENCIAT,False,False,False,False,0.039573,805,0,0,...,31,0,0,805.0,498519.10,420895,0,False,5126,14519.171693
1,01002,ABERGEMENT-DE-VAREY,False,False,False,False,0.012141,307,0,0,...,21,0,0,307.0,199398.98,228200,0,False,14771,13878.707023
2,01004,AMBERIEU-EN-BUGEY,True,False,True,False,0.584134,14771,17876,664991,...,4108,1739,0,14771.0,16242289.03,16307168,14771,False,14771,15212.998767
3,01005,AMBERIEUX-EN-DOMBES,False,False,False,False,0.109641,1757,0,0,...,147,0,0,1757.0,1126257.66,1164592,0,False,1900,14971.764453
4,01006,AMBLEON,False,False,False,False,0.006165,130,0,0,...,6,0,0,130.0,142235.84,71994,0,False,9667,13878.707023
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
35046,98829,THIO,False,False,False,False,0.000000,3580,0,0,...,0,0,0,3580.0,5031231.88,0,0,True,0,15474.082198
35047,98830,TOUHO,False,False,False,False,0.000000,3610,0,0,...,0,0,0,3610.0,3765372.17,0,0,True,0,15474.082198
35048,98831,VOH,False,False,False,False,0.000000,3750,0,0,...,0,0,0,3750.0,6258250.92,0,0,True,0,15474.082198
35049,98832,YATE,False,False,False,False,0.000000,2756,0,0,...,0,0,0,2756.0,4486678.64,0,0,True,0,15395.346878


### Analyse d'une commune

In [7]:
# Exemple de récupération des données d'une commune.
# Données avant intégration des communes nouvelles et des garanties DSU.

def get_commune_data(data, code_insee_commune):
    return data.loc[data["Informations générales - Code INSEE de la commune"] == code_insee_commune]

CODE_INSEE_UNE_COMMUNE = "01001"

# On récupère les données de la commune des jeux de données adaptés 
# car ils contiennent les mêmes noms de colonnes (pas toujours vrai des données DGCL)
df_commune_2020 = get_commune_data(adapted_data_2020, CODE_INSEE_UNE_COMMUNE)
df_commune_2021 = get_commune_data(adapted_data_2021, CODE_INSEE_UNE_COMMUNE)

NOM_COMMUNE = df_commune_2021["Informations générales - Nom de la commune"].values[0]
print("Commune analysée : " + NOM_COMMUNE)

Commune analysée : ABERGEMENT-CLEMENCIAT


In [8]:
import numpy as np
from pandas import DataFrame


def get_dataframes_diff(df1, df2, df1_title, df2_title):
    # src code : 
    # https://stackoverflow.com/questions/17095101/compare-two-dataframes-and-output-their-differences-side-by-side

    differences = (df1 != df2)
    differences_stacked = differences.stack()
    changed = differences_stacked[differences_stacked]

    difference_locations = np.where(differences)
    changed_from = df1.values[difference_locations]
    changed_to = df2.values[difference_locations]

    df_evolution = DataFrame({df1_title: changed_from, df2_title: changed_to}, index=changed.index)
    df_evolution = df_evolution.style.set_caption(NOM_COMMUNE + ", évolution des données :")
    return df_evolution

# Affiche les colonnes ayant évolué dans le temps (et seulement elles)
get_dataframes_diff(df_commune_2020, df_commune_2021, '2020', '2021')

Unnamed: 0,Unnamed: 1,2020,2021
0,part_population_canton,0.04023,0.039573
0,population_dgf,810.0,805.0
0,population_insee,794.0,789.0
0,potentiel_financier,500161.0,508380.0
0,potentiel_financier_par_habitant,617.482716,631.52795
0,revenu_total,12602586.0,13307573.0
0,effort_fiscal,0.868109,0.885623
0,nombre_logements,341.0,343.0
0,nombre_beneficiaires_aides_au_logement,39.0,31.0
0,population_dgf_majoree,810.0,805.0


## Intégration de données complémentaires
Complétion des données par les évolutions de situation des communes

In [9]:
# Initialisation du nouveau jeu de données

fully_adapted_data_2021 = adapted_data_2021

### Ajout des garanties DSU

In [10]:
from pandas import read_csv
from scripts.load_dgcl_data import insert_dsu_garanties

# Chargement des garanties DSU toutes périodes
# TODO 2022 où toutes les valeurs sont à zéro + de nouvelles communes peuvent manquer
garanties_dsu = read_csv(GARANTIES_DSU_PATH, dtype={"Informations générales - Nom de la commune": str})

# Insertion des garanties 2021 au titre de la DSU (non calculées explicitement dans OFDL)
fully_adapted_data_2021 = insert_dsu_garanties(fully_adapted_data_2021, "2021", GARANTIES_DSU_PATH)

### Ajout des garanties communes nouvelles

In [11]:
from scripts.load_dgcl_data import insert_dsr_garanties_communes_nouvelles


# Insertion des garanties communes nouvelles au titre de la DSR (non calculées explicitement dans OFDL)
fully_adapted_data_2021 = insert_dsr_garanties_communes_nouvelles(fully_adapted_data_2021, "2021")

FileNotFoundError: [Errno 2] No such file or directory: '/Users/sch/dev/gitruc/dotations-locales/tests/scripts/../../data/garanties_cn_dsr_2020.csv'

In [None]:
fully_adapted_data_2021.keys()  # 38 colonnes en 2021 (contre 34 initialement)

### Analyse des garanties DSU

#### Quelles sont les communes ayant une garantie DSU en 2021 ?

In [None]:
def filter_communes_on_column_value(data, column_name, filter):
    # ex : fully_adapted_data_2021.loc[fully_adapted_data_2021["dsu_montant_garantie_pluriannuelle"] > 0]
    filtered_data = data.loc[filter(data[column_name])]
    
    return filtered_data[
            ['Informations générales - Code INSEE de la commune',
             'Informations générales - Nom de la commune',
             column_name
            ]
        ]

# Communes ayant une garantie DSU en 2021

communes_gdsu_integrees_2021 = filter_communes_on_column_value(fully_adapted_data_2021, "dsu_montant_garantie_pluriannuelle", lambda serie: serie > 0)
# ce sont les même communes que celles avec une garantie DSU dans la colonne "2021" 
# du fichier de garanties et qu'on peut voir avec :
# communes_gdsu_initiales_2021 = garanties_dsu.loc[garanties_dsu["2021"] > 0][
#            ['Informations générales - Code INSEE de la commune',
#             'Nom de la commune',
#             '2021'
#            ]
# ]


print(str(len(communes_gdsu_integrees_2021)) + " communes ont une garantie DSU en 2021 d'après " + GARANTIES_DSU_PATH)

In [None]:
# TODO remplacer les garanties estimées pour 2021 par les garanties publiées par la DGCL

communes_gdsu_integrees_2021

#### Peut-on déduire la garantie DSU 2022 des communes ayant une garantie DSU en 2021 ?
> TODO Vérifier le périmètre couvert d'après l'ensemble règles de garantie DSU.

🍁 Cas 1 : Une garantie en 2021 seulement. 
La commune serait sortie de la DSU depuis 1 an seulement. 
On soustrait 10% pour trouver la garantie 2022.

In [None]:
filtre_dsu_2021_only = (garanties_dsu["2020"] == 0) & (garanties_dsu["2021"] > 0)
garanties_dsu_2021 = garanties_dsu.loc[filtre_dsu_2021_only]

print(str(len(garanties_dsu_2021)) + " commune(s) ont une garantie DSU depuis 2021 seulement.")

🍁 Cas 2 : Une garantie depuis plus d'un an. Avec au moins une garantie en 2021 et 2020, on peut déduire la différence de montant et la soustraire à 2021 pour obtenir la garantie 2022.

In [None]:
# Communes ayant une garantie DSU en 2020 et 2021
filtre_dsu_2020_2021 = (garanties_dsu["2020"] > 0) & (garanties_dsu["2021"] > 0) 
garanties_dsu_2020_2021 = garanties_dsu.loc[filtre_dsu_2020_2021]

# Avant calcul 2022
garanties_dsu_2020_2021

In [None]:
delta_2020_2021 = garanties_dsu_2020_2021["2020"] - garanties_dsu_2020_2021["2021"]
garanties_dsu_2022 = garanties_dsu_2020_2021["2021"] - delta_2020_2021

garanties_dsu.loc[filtre_dsu_2020_2021, "2022"] = garanties_dsu_2022.clip(lower=0)

# Après calcul 2022 (pour les communes ayant une garantie en 2020 et 2021)
garanties_dsu[filtre_dsu_2020_2021]

🍁 Cas 3 ? : La commune percevait la DSU en 2021 mais, avec les données DGCL 2021, on estime qu'elle ne percevra pas la DSU en 2022. Pas possible au regard des informations mais vérifier après mise à jour des garanties avec les nouvelles données ?

+ TODO : vérifier autres cas de garanties DSU.

### Communes nouvelles 2021
> Objectif : créer un fichier assets/data/garanties_cn_dsr_2021.csv
> avec pour colonnes : 
> Informations générales - Code INSEE de la commune,
> nom_commune,
> dsr_garantie_commune_nouvelle_fraction_cible,
> dsr_garantie_commune_nouvelle_fraction_perequation,
> dsr_garantie_commune_nouvelle_fraction_bourg_centre

In [None]:
# Communes nouvelles 2021
# https://fr.wikipedia.org/wiki/Liste_des_communes_nouvelles_créées_en_2021

# 16233 - Mosnac-Saint-Simeux - Chef lieu : Mosnac
# était : Mosnac + Saint-Simeux
filter_code_mosnac = adapted_data_2021['Informations générales - Code INSEE de la commune'] == '16233'
filter_nom_mosnac = adapted_data_2021['Informations générales - Nom de la commune'] == 'MOSNAC-SAINT-SIMEUX'
adapted_data_2021.loc[filter_code_mosnac]


# 53249 - Vimartin-sur-Orthe - Chef lieu : Saint-Pierre-sur-Orthe
# était : Saint-Martin-de-Connée, Saint-Pierre-sur-Orthe et Vimarcé
filter_code_vimartin_sur_orthe = adapted_data_2021['Informations générales - Code INSEE de la commune'] == '53249'
adapted_data_2021.loc[filter_code_vimartin_sur_orthe]


In [None]:
from openfisca_france_dotations_locales import CountryTaxBenefitSystem as DotationsLocales

from scripts.simulation import simulation_from_dgcl_csv
from scripts.load_dgcl_data import get_last_year_dotations


tbs = DotationsLocales()

results_2020_as_last_year = get_last_year_dotations(dgcl_data_2020)
data_2020_as_last_year = results_2020_as_last_year[[
    "Informations générales - Code INSEE de la commune", 
    "dsu_montant_eligible", 
    "dsr_montant_eligible_fraction_bourg_centre", 
    "dsr_montant_eligible_fraction_perequation", 
    "dsr_montant_hors_garanties_fraction_cible", 
    "population_dgf_majoree", 
    "dotation_forfaitaire"
]]



# Simulation à partir de données DGCL de la même année, complétées.
simulation_2021 = simulation_from_dgcl_csv(
    "2021", 
    fully_adapted_data_2021, 
    tbs, 
    data_previous_year=data_2020_as_last_year
)

In [None]:
# Quel est l'index de la commune nouvelle dans la simulation ?
import numpy as np

# for population in simulation_2021.populations.values():
#    if population.entity.is_person:
#        population.ids

# population_dgf = simulation_2021.calculate("population_dgf", 2021)
# population_dgf
# vimartin = np.where(population_dgf == 1303) > (array([ 3592, 11470, 12600, 19408, 21371, 26169, 26974]),)

recettes_reelles_fonctionnement = simulation_2021.calculate("recettes_reelles_fonctionnement", 2021)
indexes_vimartin_sur_orthe = np.where(recettes_reelles_fonctionnement == 525455.89)

indexes_vimartin_sur_orthe[0] # == 19408
index_vimartin_sur_orthe = 19408

# Un autre indice pour confirmer que c'est bien Vimartin-sur-Orthe ?
revenu_par_habitant_moyen = simulation_2021.calculate("revenu_par_habitant_moyen", 2021)
revenu_par_habitant_moyen[index_vimartin_sur_orthe] == 14971.765 # False alors que 14971.765 == 14971.764453 !

In [None]:
print("Nouvelle vie de Vimartin-sur-Orthe : ")

dsr_garantie_commune_nouvelle_fraction_cible = simulation_2021.calculate("dsr_garantie_commune_nouvelle_fraction_cible", 2021)
print("dsr_garantie_commune_nouvelle_fraction_cible : ", dsr_garantie_commune_nouvelle_fraction_cible[index_vimartin_sur_orthe])

dsr_garantie_commune_nouvelle_fraction_perequation = simulation_2021.calculate("dsr_garantie_commune_nouvelle_fraction_perequation", 2021)
print("dsr_garantie_commune_nouvelle_fraction_perequation : ", dsr_garantie_commune_nouvelle_fraction_perequation[index_vimartin_sur_orthe])

dsr_garantie_commune_nouvelle_fraction_bourg_centre = simulation_2021.calculate("dsr_garantie_commune_nouvelle_fraction_bourg_centre", 2021)
print("dsr_garantie_commune_nouvelle_fraction_bourg_centre : ", dsr_garantie_commune_nouvelle_fraction_bourg_centre[index_vimartin_sur_orthe])

In [None]:
indexes_mosnac_st_simeux = np.where(recettes_reelles_fonctionnement == 576752.59) # = 5394
index_mosnac_st_simeux = 5394

print("Nouvelle vie de Mosnac-Saint-Simeux : ")

dsr_garantie_commune_nouvelle_fraction_cible = simulation_2021.calculate("dsr_garantie_commune_nouvelle_fraction_cible", 2021)
print("dsr_garantie_commune_nouvelle_fraction_cible : ", dsr_garantie_commune_nouvelle_fraction_cible[index_mosnac_st_simeux])

dsr_garantie_commune_nouvelle_fraction_perequation = simulation_2021.calculate("dsr_garantie_commune_nouvelle_fraction_perequation", 2021)
print("dsr_garantie_commune_nouvelle_fraction_perequation : ", dsr_garantie_commune_nouvelle_fraction_perequation[index_mosnac_st_simeux])

dsr_garantie_commune_nouvelle_fraction_bourg_centre = simulation_2021.calculate("dsr_garantie_commune_nouvelle_fraction_bourg_centre", 2021)
print("dsr_garantie_commune_nouvelle_fraction_bourg_centre : ", dsr_garantie_commune_nouvelle_fraction_bourg_centre[index_mosnac_st_simeux])

In [None]:
# !pip list