Skip to content

Aplicación para obtener los datos de las candidaturas a las elecciones autonómicas de la Comunidad de Madrid en los últimos años

License

Notifications You must be signed in to change notification settings

franloza/infoelectoral-madrid

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

infoelectoral-madrid

License

Aplicación para obtener los datos de las candidaturas a las elecciones autonómicas de la Comunidad de Madrid en los últimos años.

Repositorio inspirado en infoelectoral de JaimeObregon. Este repositorio surge de la necesidad de acudir a los portales de cada gobierno autómico para obtener las candidaturas (Ver Issue)

Esta aplicación genera un fichero CSV con los documentos obtenidos del portal de la JEC correspondientes a las elecciones autonómicas de Madrid, celebradas entre 2007 y 2019.

Proceso

  1. He añadido todos los documentos en formato comprimido en la carpeta files/pdf. Para añadir algún fichero mas, solo es necesario añadir la URL y la fecha a files/info.csv y ejecutar el script files/download.sh
  2. He descomprimido los documentos PDF y he usado la CLI de pdfminer.six para extraer la versión en texto de los documentos. La versión .txt no es del todo perfecta así que he adaptado los ficheros de manera manual para tener la siguiente estructura:
PARTIDO #2(SIGLAS)
1. Candidato #1
2. Candidato #2
...
Suplentes
1. Suplente #1
...

PARTIDO #2 (SIGLAS)
...
  1. He comprimido los ficheros .txt en la carpeta files/txt.

Requisitos

  • Docker o Python>=3.7

Obtener datos

make run > data.csv o python3 src/parse.py files > data.csv

About

Aplicación para obtener los datos de las candidaturas a las elecciones autonómicas de la Comunidad de Madrid en los últimos años

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published