# Chargement des données

In [61]:
# code inspiré de https://git.regardscitoyens.org/regardscitoyens/sprint-scrutins/blob/master/votes_an/ancsv.py

import glob, json, csv, collections

# recupere les députés

députés = list(csv.DictReader(open('liste_deputes_libre_office.csv')))
députés_par_id = {int(député["identifiant"]): député for député in députés}

"""
pour chaque députés récuperer ses votes
ensuite les regrouper par semaine
faire une mediane du nombre de votes par semaine
"""

# recuperer les votes

votes_par_députés = {id_député: collections.defaultdict(list) for id_député in députés_par_id}

for fichier in glob.glob('scrutins/*.json'):
    scrutin = json.load(open(fichier))['scrutin']

    id_scrutin = scrutin['numero']

    groupes = scrutin['ventilationVotes']['organe']['groupes']['groupe']

    for groupe in groupes:
        dn = groupe['vote']['decompteNominatif']
        
        for position in ('pour', 'contre', 'abstention'):
            votants_position = dn['%ss' % position]
            
            if not votants_position:
                continue
            
            votants = votants_position['votant']

            if not isinstance(votants, list):
                votants = [votants]

            for votant in votants:
                votant_id = int(votant['acteurRef'][2:])
                
                if votant.get('parDelegation', 'false') == 'false':
                    continue

                if votant_id in votes_par_députés:
                    votes_par_députés[votant_id][scrutin['dateScrutin']].append(position)


In [53]:
from bokeh.io import output_notebook
output_notebook()

In [63]:
import datetime, statistics

# grouper par semaine

votes_par_mois = collections.defaultdict(dict)

for député, dates in votes_par_députés.items():
    for date, votes in dates.items():
        année, mois, jour = date.split('-')
        mois_complet = f"{année}-{mois}"
        votes_par_mois[mois_complet][député] = votes
        
def mediane_votes(votes):
    return statistics.median([len(votes.get(député, [])) for député in députés_par_id])

from bokeh.io import show
from bokeh.plotting import figure
        
tout_les_mois = sorted(votes_par_mois.keys())

députés_les_moins_présents = sorted(votes_par_députés.keys(),
                                    key=lambda député: sum([len(votes) for votes in votes_par_députés[député].values()]))

for député in députés_les_moins_présents[-5:]:
    votes = [len(votes_par_mois[mois].get(député, [])) for mois in tout_les_mois]
    votes_median = [mediane_votes(votes_par_mois[mois]) for mois in tout_les_mois]

    p = figure(x_range=tout_les_mois, plot_width=700, plot_height=400,
               title=f"Votes par mois pour {députés_par_id[député]['Prénom']} {députés_par_id[député]['Nom']}",
               toolbar_location=None, tools="")

    p.step(tout_les_mois, votes_median, line_width=2, line_color="red", mode="before", alpha=0.8, legend_label='Médiane de tous les députés')
    p.vbar(x=tout_les_mois, top=votes, width=1, alpha=0.5)

    p.y_range.start = 0
    p.y_range.end = 10
    p.xgrid.grid_line_color = None
    p.ygrid.grid_line_color = None
    show(p)


In [None]:
# todo: trous dans les mois, legende abscisse claire (mois), plot line not aligned