# Elections et cartes électorales - énoncé

In [None]:
from pyquickhelper.ipythonhelper import add_notebook_menu
add_notebook_menu()

D'après wikipédia, le [Gerrymandering](https://fr.wikipedia.org/wiki/Gerrymandering) est un terme politique nord-américain pour désigner le découpage des circonscriptions électorales ayant pour objectif de donner l’avantage à un parti, un candidat, ou un groupe donné. Et c'est ce que nous allons faire dans cette séance.

## Données

Les données sont deux types, les résultats aux précédentes élections législatives et la définition géométrique de chaque circonscription.

* [Résultat des élections législatives françaises de 2012 au niveau bureau de vote](https://www.data.gouv.fr/fr/datasets/resultat-des-elections-legislatives-francaises-de-2012-au-niveau-bureau-de-vote-nd/)
* [Countours des circonscriptions des législatives](https://www.data.gouv.fr/fr/datasets/countours-des-circonscriptions-des-legislatives-nd/)

On peut télécharger cette donnée ou les récupérer via les fonctions implémentées dans ce module.

### Résultats des élections législatives

In [None]:
from actuariat_python.data import elections_legislatives_bureau_vote
tour = elections_legislatives_bureau_vote()

In [None]:
tour["T2"].sort_values(["Code département", "N° de circonscription Lg"]).head()

Unnamed: 0,N° tour,Code département,Code de la commune,Nom de la commune,N° de circonscription Lg,N° de canton,N° de bureau de vote,Inscrits,Votants,Exprimés,N° de dépôt du candidat,Nom du candidat,Prénom du candidat,Code nuance du candidat,Nombre de voix du candidat
3858,2,1,16,Arbigny,1,26,1,309,146,144,32,BRETON,Xavier,UMP,87
3859,2,1,16,Arbigny,1,26,1,309,146,144,33,DEBAT,Jean-François,SOC,57
3871,2,1,24,Attignat,1,21,1,746,425,411,32,BRETON,Xavier,UMP,233
3872,2,1,24,Attignat,1,21,1,746,425,411,33,DEBAT,Jean-François,SOC,178
3873,2,1,24,Attignat,1,21,2,1311,801,792,32,BRETON,Xavier,UMP,446


### Géolocalisation des circonscription

In [None]:
from actuariat_python.data import elections_legislatives_circonscription_geo
geo = elections_legislatives_circonscription_geo()

In [None]:
geo.sort_values(["department", "code_circonscription"]).head()

Unnamed: 0,code_circonscription,department,numero,communes,kml_shape,simple_form
11,1001,1,1,01053-01072-01106-01150-01177-01184-01195-0124...,<Polygon><outerBoundaryIs><LinearRing><coordin...,False
12,1002,1,2,01008-01047-01099-01202-01213-01224-01366-0138...,<Polygon><outerBoundaryIs><LinearRing><coordin...,True
13,1003,1,3,01033-01044-01081-01091-01174-01189-01215-0125...,<Polygon><outerBoundaryIs><LinearRing><coordin...,True
14,1004,1,4,01023-01025-01026-01144-01159-01231-01320-0133...,<Polygon><outerBoundaryIs><LinearRing><coordin...,False
15,1005,1,5,01002-01004-01007-01041-01089-01149-01345-0137...,<Polygon><outerBoundaryIs><LinearRing><coordin...,True


In [None]:
c = list(geo.sort_values(["department", "code_circonscription"])["communes"])[0].split("-")
c.sort()
c[:5]

['01016', '01024', '01029', '01038', '01040']

In [None]:
list(geo.sort_values(["department", "code_circonscription"])["kml_shape"])[:1]

['<Polygon><outerBoundaryIs><LinearRing><coordinates>5.294455999999968,46.193934 5.279780999999957,46.201967 5.2820520000000215,46.211633 5.258239693115229,46.21151582325097 5.2581992646485105,46.2083773977195 5.246123010742167,46.20489445115752 5.245254158935495,46.20280868033653 5.240432576904368,46.199348983660926 5.23716710070812,46.19529946757567 5.229953412841837,46.195408656674 5.226543291137659,46.20120799400516 5.214944595275824,46.20383315680887 5.210212354492228,46.20764618417071 5.205343111083948,46.20376238484074 5.206997000000001,46.191323 5.19510600000001,46.18786 5.187468999999965,46.190827 5.170859999999948,46.203126 5.162395999999944,46.199387 5.15610700000002,46.189904 5.142047000000048,46.192223 5.123888999999963,46.207671 5.111119000000031,46.203891 5.097426000000041,46.206108 5.089811999999938,46.195268 5.068122000000017,46.208969 5.058287999999948,46.22074 5.05758000000003,46.224014 5.065923999999995,46.231556 5.093984999999975,46.232529 5.095609999999965,46.2356

### Géolocation des bureaux de vote

Ces données sont importantes afin de pouvoir associer chaque bureau à une circonscription. Les bureaux sont assez stables d'une élection à l'autre et cela ne devrait pas trop poser de problèmes si on mélane les données. En revanche, ces données sont assez difficiles à obtenir. [open.data.fr](https://www.data.gouv.fr/fr/datasets/?q=bureaux+de+vote&page=1) propose ces données mais il faut récupérer chaque ville ou chaque région séparément sans garantie de réussir à couvrir tout le territoire. Le site [NosDonnes.fr](http://www.nosdonnees.fr/dataset/golocalisation-des-bureaux-de-votes) recense bien toutes ces informations mais il n'est pas possible - au moment où j'écris ces lignes - de récupérer ces données sous la forme d'un fichier plat. De plus, certaines régions ne sont disponibles que sous forme de scan d'impressions papier. C'est en lisant l'article [Comment redécoupe-t-on la carte électorale?](http://www.slate.fr/story/3945/comment-redecouper-t-la-carte-electorale) que je suis tombé finalement sur la base constituée pour rédiger l'article [Etude sur le redécoupage électoral : évaluer le poids politique de la réforme](https://www.regardscitoyens.org/etude-sur-le-redecoupage-electoral-poids-politique-reforme/). Les données sont accessibles sur [RegardsCitoyens.fr](https://www.regardscitoyens.org/publication/#donnees) et en cherchant bien, on trouve le répertoire [redécoupage](https://www.regardscitoyens.org/telechargement/redecoupage/) et le fichier [2014041401_resultats.csv.zip](https://www.regardscitoyens.org/telechargement/redecoupage/2014041401_resultats.csv.zip). Cependant, la géolocalisation des bureaux n'est pas souvent renseignée. On peut se contenter des fichiers obtenus pour quelques zones seulement : [Paris](https://www.data.gouv.fr/fr/datasets/liste-des-bureaux-de-vote-prs/), [Gironde](https://www.data.gouv.fr/fr/datasets/geo-localisation-des-bureaux-de-vote-du-departement-de-la-gironde-rdl/), [Montpellier](https://www.data.gouv.fr/fr/datasets/bureaux-de-vote-mtn/), [Marseille](https://www.data.gouv.fr/fr/datasets/bureaux-de-vote-de-marseille-op/), [Saint-Malo](https://www.data.gouv.fr/fr/datasets/emplacement-des-bureaux-de-vote/), [Nogent-Sur-Marne](https://www.data.gouv.fr/fr/datasets/bureaux-de-vote-de-la-ville-de-nogent-sur-marne/), [Haut-de-Seine](https://www.data.gouv.fr/fr/datasets/bureaux-de-vote-7/), [Toulouse](https://www.data.gouv.fr/fr/datasets/bureaux-de-vote-2012/), [Grand-Poitiers](https://www.data.gouv.fr/fr/datasets/citoyennete-bureaux-de-vote-grand-poitiers-donnees-de-reference/), [Calvados](https://www.data.gouv.fr/fr/datasets/bureaux-centralisateurs-des-circonscriptions-cantonales-dans-le-calvados/). Cette approche risque d'être fastidieuse dans la mesure où les formats pour chaque ville ont de grande chance d'être différent. 

La meilleure option est peut-être de scrapper le site [bureaudevote.fr](http://bureaudevote.fr/bureaudevote00.htm) - qui fonctionne bien quand il n'est pas en maintenance - en espérant que les numéros des bureaux de votes correspondent. Le site propose seulement les adresses. Il faudra utiliser une API de geocoding. Quelque soit la source, on supposera alors que tous les bureaux de vote associés au même emplacement feront nécessairement partie de la même circonscription. Bref, **l'open data passe aussi par une certaine standardisation !**

Certains départements ne sont pas renseignés, la Drôme par exemple. Il faut aller sur d'autres sites comme [linternaute.com](http://www.linternaute.com/ville/valence/ville-26362/bureaux-vote#ville-26362-1), accéder à la [carte](http://www.linternaute.com/ville/p-bureau-vote#trouver-bureau-vote), mais il faudra un peu plus de temps pour récupérer toutes ces informations. Le code proposé ci-dessus récupère les coordonnées des bureaux de vote. Cela prend plusieurs heures et il faut relancer le processus quand il s'arrête pour une erreur de réseau. Il est conseillé de télécharger le résultat. Le géocodeur d'[OpenStreetMap](http://openstreetmap.fr/) n'est pas de très bonne qualité sur la France. Il ne retourne rien dans plus d'un tiers des cas. On peut compléter avec l'[API de Bing Maps](https://www.microsoft.com/maps/choose-your-bing-maps-API.aspx).

In [1]:
from actuariat_python.data import elections_vote_place_address
bureau = elections_vote_place_address(hide_warning=True)

In [2]:
bureau.head()

Unnamed: 0,address,city,n,place,zip
0,cours verdun,bourg,1,salle des fêtes,1000
1,cours verdun,bourg,2,salle des fêtes,1000
2,rue antoine de saint exupéry,bourg-en-bresse,3,"groupe scolaire saint-exupéry - salle de jeux,...",1000
3,11 avenue de l’égalité,bourg-en-bresse,4,charles perrault - école primaire,1000
4,11 avenue de l’égalité,bourg-en-bresse,5,charles perrault - école primaire,1000


On récupère une clé pour utiliser l'[API de Bing Maps](https://www.microsoft.com/maps/choose-your-bing-maps-API.aspx) avec le module [keyring](http://pythonhosted.org/keyring/). Pour stocker son mot de passe sur la machine, il suffit d'écrire :

```
import keyring
keyring.set_password("bing", os.environ["COMPUTERNAME"], "key")
```

In [None]:
import keyring, os
bing_key = keyring.get_password("bing", os.environ["COMPUTERNAME"])
coders = ["Nominatim"]
if bing_key:
    # si la clé a été trouvée
    coders.append(("bing", bing_key))
len(coders)

2

In [None]:
from actuariat_python.data import geocode
from pyquickhelper.loghelper import fLOG
fLOG(OutputPrint=True)
bureau_geo = geocode(bureau, fLOG=fLOG, index=False, encoding="utf-8",
                     exc=False, save_every="bureau.dump.txt", sep="\t", every=100,
                     coders=coders)

2016-09-20 22:30:07 load  bureau.dump.txt
2016-09-20 22:30:07 saving place 0/11207 - errors=0 - no-result=0
2016-09-20 22:31:09 saving place 100/11207 - errors=0 - no-result=11
2016-09-20 22:32:20 saving place 200/11207 - errors=0 - no-result=11
2016-09-20 22:32:52 saving place 300/11207 - errors=0 - no-result=11
2016-09-20 22:34:19 saving place 400/11207 - errors=0 - no-result=11
2016-09-20 22:35:19 saving place 500/11207 - errors=0 - no-result=11
2016-09-20 22:36:48 saving place 600/11207 - errors=0 - no-result=16
2016-09-20 22:37:33 saving place 700/11207 - errors=0 - no-result=16
2016-09-20 22:38:54 saving place 800/11207 - errors=0 - no-result=21


On pourra finalement récupérer la base des géocodes comme ceci :

In [None]:
from actuariat_python.data import elections_vote_places_geo
places = elections_vote_places_geo()
places.head()

## Exercice 1

* Etablir un plan d'action
* Détailler la mise en oeuvre de ce plan à partir des données
* Répartir les tâches sur plusieurs équipes

## Exercice 2

Mettre en oeuvre le plan d'action.