Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

¿Tiene sentido incorporar las elecciones autonómicas? #2

Open
JaimeObregon opened this issue Jul 28, 2020 · 9 comments
Open

¿Tiene sentido incorporar las elecciones autonómicas? #2

JaimeObregon opened this issue Jul 28, 2020 · 9 comments
Labels
help wanted Extra attention is needed

Comments

@JaimeObregon
Copy link
Owner

JaimeObregon commented Jul 28, 2020

Lo he documentado en la sección de las elecciones autonómicas: el Ministerio no ofrece ningún dato de ellas, y habría que acudir a los portales de cada gobierno autonómico. Y son 17, más dos ciudades autónomas.

Y en estos portales los datos —los de candidaturas y candidatos como mínimo— no tienen siquiera por qué existir de forma reutilizable. Y en caso afirmativo, habría que escribir funciones a medida para importar los registros de cada comunidad y homogeneizar su tratamiento con el que se hace aquí para el resto de procesos electorales de que el Ministerio sí es responsable.

Se trata, en definitiva, de un esfuerzo importante con un retorno impredecible, pues con toda seguridad no podrán obtenerse datos electorales reutilizables de todas las comunidades autónomas. Y de las que sí, cada una lo hará desde un año diferente.

Por lo tanto cabe aquí lanzarse una pregunta: ¿merece la pena este esfuerzo para incorporar los datos de las elecciones autonómicas, o nos resignamos sin ellos?.

@JaimeObregon JaimeObregon added help wanted Extra attention is needed good first issue Good for newcomers question Further information is requested labels Jul 28, 2020
@JaimeObregon JaimeObregon changed the title ¿Tiene sentido incorporar las elecciones autonómicas? ¿Tiene sentido incorporar las elecciones autonómicas yendo comunidad a comunidad? Jul 28, 2020
@JaimeObregon JaimeObregon changed the title ¿Tiene sentido incorporar las elecciones autonómicas yendo comunidad a comunidad? ¿Tiene sentido incorporar las elecciones autonómicas, comunidad a comunidad? Jul 28, 2020
@JaimeObregon JaimeObregon changed the title ¿Tiene sentido incorporar las elecciones autonómicas, comunidad a comunidad? ¿Tiene sentido incorporar las elecciones autonómicas? Jul 28, 2020
@mtaberna
Copy link

En mi opinión, no tiene sentido un único frente para acometer esa tarea, sería muy costosa y veo mayor potencial invirtiendo ese tiempo en otras prioridades.

No obstante, creo que podrías liderar un esfuerzo colaborativo, al estilo crowdsourcing. Si proporcionas unas especificaciones de datos sólidas, o unas especificaciones para una API completas, diversos voluntarios se podrían adherir y con el tiempo mantener su comunidad autónoma.

Por último, aunque no es únicamente aplicable a este problema, creo que adoptar una filosofía similar a los microservicios para un proyecto colaborativo de open data puede ser muy beneficioso. En un hipotético caso, cualquier colaborador dispondría de un servicio API al que enviar datos (llamado Chanchullopedia API pej.) que funciona como un marketplace de diversas fuentes de datos. Esto permitiría dividir una tarea costosa, como la de recolectar datos autonómicas, entre colaboradores con un protocolo pactado y especificaciones.

@LuisMayo
Copy link

En mi opinión, si se documenta un formato de datos homogéneo cualquiera puede ir creando scripts o adaptadores que se descarguen los datos de las diferentes administraciones y los conviertan al formato de salida deseado.

Sentido tiene, sobre todo si el propósito final de este proyecto es descubrir los chanchullos , sobre todo teniendo en cuenta que los más grandes escándalos de corrupción han sido a nivel autonómico en su mayoría, no me extrañaría que hubiera más chanchullos pequeños.

No obstante puede ser mucho trabajo para el proyecto principal, por eso dejar una API como dice @beatplus , o un formato de fichero común hará que la gente pueda contribuir mientras en el proyecto principal se emplea el tiempo en otras cosas.

Si alguna comunidad no es procesable automáticamente pues no se crea adaptador para ella, pero para los que si las tengamos mejor, supongo

@JaimeObregon
Copy link
Owner Author

Me parece todo bien. En resumen:

  • Especificar un formato o API para recibir los datos y convocar después un crowdsourcing
  • Que ello no detraiga ahora esfuerzos de la misión principal, pues esto puede posponerse o paralelizarse

@mtaberna
Copy link

Añadiría un paso 0, proporcionar una estructura básica de datos deseados para este caso específico (columnas necesarias, posibles valores y formatos).

Dado que una API e ingestión de datos es un proyecto más ambicioso, subidas de ficheros en masa con una misma estructura puede ser un buena solución intermedia

@ghost
Copy link

ghost commented Jul 29, 2020

Creo que estaría bien tener cuantos más datos posibles mejor, pero con varios frentes abiertos de forma colaborativa. Una plataforma tipo Kaggle en que los usuarios pueden publicar y utilizar datasets.

Lo mejor sería un sistema en que poder leer y escribir datos tanto desde el navegador (formatos CSV, JSON y similares) y mediante API (lo mejor sería REST y/o GraphQL) para usar programáticamente.

Con lo cual habría que

  • Especificar un formato en que se publiquen los datos (como podría ser un esquema SQL)
  • Buscar un modo de publicar estos datos
  • Conseguir estos datos y publicarlos

@JaimeObregon JaimeObregon removed good first issue Good for newcomers question Further information is requested labels Aug 3, 2020
@JaimeObregon
Copy link
Owner Author

La fuente primaria parece esta página de la Junta Electoral Central, que enlaza a a su vez a los boletines autonómicos en cuestión, cada uno de los cuales hay que procesar por separado.

Una primera estimación de esfuerzo: hay 19 autonomías y ciudades autónomas, y unos 10 procesos electorales en cada una (aproximadamente), lo que supone procesar en torno a 200 documentos PDF.

@JaimeObregon
Copy link
Owner Author

He procesado el sitio de la JEC y ahora puedo concretar un poco más. Se trata de exactamente estos 192 procesos electorales. La mayoría de ellos conlleva un fichero PDF, pero algunos procesos tienen ficheros adicionales con corrección de errores:

cantabria/26-de-mayo-de-2019
cantabria/24-de-mayo-de-2015
cantabria/22-de-mayo-de-2011
cantabria/27-de-mayo-de-2007
cantabria/25-de-mayo-de-2003
cantabria/13-de-junio-de-1999
cantabria/28-de-mayo-de-1995
cantabria/26-de-mayo-de-1991
cantabria/10-de-junio-de-1987
cantabria/8-de-mayo-de-1983
canarias/26-de-mayo-de-2019
canarias/24-de-mayo-de-2015
canarias/22-de-mayo-de-2011
canarias/27-de-mayo-de-2007
canarias/25-de-mayo-de-2003
canarias/13-de-junio-de-1999
canarias/28-de-mayo-de-1995
canarias/26-de-mayo-de-1991
canarias/10-de-junio-de-1987
canarias/8-de-mayo-de-1983
illes-balears/26-de-mayo-de-2019
illes-balears/24-de-mayo-de-2015
illes-balears/22-de-mayo-de-2011
illes-balears/27-de-mayo-de-2007
illes-balears/25-de-mayo-de-2003
illes-balears/18-de-mayo-de-1999
illes-balears/28-de-mayo-de-1995
illes-balears/26-de-mayo-de-1991
illes-balears/10-de-junio-de-1987
illes-balears/8-de-mayo-de-1983
asturias/26-de-mayo-de-2019
asturias/24-de-mayo-de-2015
asturias/25-de-marzo-de-2012
asturias/22-de-mayo-de-2011
asturias/27-de-mayo-de-2007
asturias/25-de-mayo-de-2003
asturias/13-de-junio-de-1999
asturias/28-de-mayo-de-1995
asturias/26-de-mayo-de-1991
asturias/10-de-junio-de-1987
asturias/8-de-mayo-de-1983
aragon/26-de-mayo-de-2019
aragon/24-de-mayo-de-2015
aragon/22-de-mayo-de-2011
aragon/27-de-mayo-de-2007
aragon/25-de-mayo-de-2003
aragon/13-de-junio-de-1999
aragon/28-de-mayo-de-1995
aragon/26-de-mayo-de-1991
aragon/10-de-junio-de-1987
aragon/8-de-mayo-de-1983
andalucia/2-de-diciembre-de-2018
andalucia/22-de-marzo-de-2015
andalucia/25-de-marzo-de-2012
andalucia/9-de-marzo-de-2008
andalucia/14-de-marzo-de-2004
andalucia/12-de-marzo-de-2000
andalucia/3-de-marzo-de-1996
andalucia/12-de-junio-de-1994
andalucia/23-de-junio-de-1990
andalucia/22-de-junio-de-1986
andalucia/23-de-mayo-de-1982
castilla-la-mancha/26-de-mayo-de-2019
castilla-la-mancha/24-de-mayo-de-2015
castilla-la-mancha/22-de-mayo-de-2011
castilla-la-mancha/27-de-mayo-de-2007
castilla-la-mancha/25-de-mayo-de-2003
castilla-la-mancha/13-de-Junio-de-1999
castilla-la-mancha/28-de-mayo-de-1995
castilla-la-mancha/26-de-mayo-de-1991
castilla-la-mancha/10-de-junio-de-1987
castilla-la-mancha/8-de-mayo-de-1983
castilla-y-leon/26-de-mayo-de-2019
castilla-y-leon/24-de-mayo-de-2015
castilla-y-leon/22-de-mayo-de-2011
castilla-y-leon/27-de-mayo-de-2007
castilla-y-leon/25-de-mayo-de-2003
castilla-y-leon/13-de-junio-de-1999
castilla-y-leon/28-de-mayo-de-1995
castilla-y-leon/26-de-mayo-de-1991
castilla-y-leon/10-de-junio-de-1987
castilla-y-leon/8-de-mayo-de-1983
cataluna/21-de-diciembre-de-2017
cataluna/27-de-septiembre-de-2015
cataluna/25-de-noviembre-de-2012
cataluna/28-de-noviembre-de-2010
cataluna/1-de-noviembre-de-2006
cataluna/16-de-noviembre-de-2003
cataluna/17-de-octubre-de-1999
cataluna/19-de-noviembre-de-1995
cataluna/15-de-marzo-de-1992
cataluna/29-de-mayo-de-1988
cataluna/29-de-abril-de-1984
cataluna/20-de-marzo-de-1980
extremadura/26-de-mayo-de-2019
extremadura/24-de-mayo-de-2015
extremadura/22-de-mayo-de-2011
extremadura/27-de-mayo-de-2007
extremadura/25-de-mayo-de-2003
extremadura/13-de-junio-de-1999
extremadura/28-de-mayo-de-1995
extremadura/26-de-mayo-de-1991
extremadura/10-de-junio-de-1987
extremadura/8-de-mayo-de-1983
galicia/5-de-abril-de-2020
galicia/25-de-septiembre-de-2016
galicia/21-de-octubre-de-2012
galicia/1-de-marzo-de-2009
galicia/19-de-junio-de-2005
galicia/21-de-octubre-de-2001
galicia/19-de-octubre-de-1997
galicia/17-de-octubre-de-1993
galicia/17-de-diciembre-de-1989
galicia/24-de-noviembre-de-1985
galicia/20-de-octubre-de-1981
madrid/26-de-mayo-de-2019
madrid/24-de-mayo-de-2015
madrid/22-de-mayo-de-2011
madrid/27-de-mayo-de-2007
madrid/26-de-octubre-de-2003
madrid/25-de-mayo-de-2003
madrid/13-de-junio-de-1999
madrid/28-de-mayo-de-1995
madrid/26-de-mayo-de-1991
madrid/10-de-junio-de-1987
madrid/8-de-mayo-de-1983
murcia/26-de-mayo-de-2019
murcia/24-de-mayo-de-2015
murcia/22-de-mayo-de-2011
murcia/27-de-mayo-de-2007
murcia/25-de-mayo-de-2003
murcia/13-de-junio-de-1999
murcia/28-de-mayo-de-1995
murcia/26-de-mayo-de-1991
murcia/10-de-junio-de-1987
murcia/8-de-mayo-de-1983
navarra/26-de-mayo-de-2019
navarra/24-de-mayo-de-2015
navarra/22-de-mayo-de-2011
navarra/27-de-mayo-de-2007
navarra/25-de-mayo-de-2003
navarra/13-de-junio-de-1999
navarra/28-de-mayo-de-1995
navarra/26-de-mayo-de-1991
navarra/10-de-junio-de-1987
navarra/8-de-mayo-de-1983
navarra/3-de-abril-de-1979
pais-vasco/5-de-abril-de-2020
pais-vasco/25-de-septiembre-de-2016
pais-vasco/21-de-octubre-de-2012
pais-vasco/1-de-marzo-de-2009
pais-vasco/17-de-abril-de-2005
pais-vasco/13-de-mayo-de-2001
pais-vasco/25-de-octubre-de-1998
pais-vasco/23-de-octubre-de-1994
pais-vasco/28-de-octubre-de-1990
pais-vasco/30-de-noviembre-de-1986
pais-vasco/26-de-febrero-de-1984
pais-vasco/9-de-marzo-de-1980
la-rioja/26-de-mayo-de-2019
la-rioja/24-de-mayo-de-2015
la-rioja/22-de-mayo-de-2011
la-rioja/27-de-mayo-de-2007
la-rioja/25-de-mayo-de-2003
la-rioja/13-de-junio-de-1999
la-rioja/28-de-mayo-de-1995
la-rioja/26-de-mayo-de-1991
la-rioja/10-de-junio-de-1987
la-rioja/8-de-mayo-de-1983
comunitat-valenciana/28-de-abril-de-2019
comunitat-valenciana/24-de-mayo-de-2015
comunitat-valenciana/22-de-mayo-de-2011
comunitat-valenciana/27-de-mayo-de-2007
comunitat-valenciana/25-de-mayo-de-2003
comunitat-valenciana/13-de-junio-de-1999
comunitat-valenciana/28-de-mayo-de-1995
comunitat-valenciana/26-de-mayo-de-1991
comunitat-valenciana/10-de-junio-de-1987
comunitat-valenciana/8-de-mayo-de-1983
ceuta/26-de-mayo-de-2019
ceuta/24-de-mayo-de-2015
ceuta/22-de-mayo-de-2011
ceuta/27-de-mayo-de-2007
ceuta/25-de-mayo-de-2003
ceuta/13-de-junio-de-1999
ceuta/28-de-mayo-de-1995
melilla/26-de-mayo-de-2019
melilla/24-de-mayo-de-2015
melilla/22-de-mayo-de-2011
melilla/27-de-mayo-de-2007
melilla/13-de-junio-de-1999
melilla/28-de-mayo-de-1995

@franloza
Copy link

franloza commented Feb 4, 2021

He parseado los PDFs de los años 2015 y 2019 para la Comunidad de Madrid en este repositorio. Me gustaría saber cómo podría aportar los datos a este repositorio. Creo que cobrarían mas valor si hubiera alguna manera de estandarizarlos con el resto de los datos.

El esquema del CSV que se genera es este:

nombre_candidato:  String
num_candidatura: Integer
es_suplente: Boolean
nombre_partido: String
abbr_partido: String
fecha: String

Especificar un formato o API para recibir los datos y convocar después un crowdsourcing

Iterando en esta idea, ¿crees que podríamos llegar a definir ese formato?. Quiero seguir trabajando para hacer más transparentes los datos de Madrid y me gustaría unificar esfuerzos en este sentido. Estoy seguro que habría mucha más gente interesada en sumarse a esta iniciativa.

@gabriel-lucas
Copy link

En primer lugar gracias por remangarte con todo esto @JaimeObregon

Esta "issue" se puede resolver técnicamente pero entiendo que sería mejor que la administración se hiciera cargo de publicar esta información adecuadamente.

¿Habéis intentado realizar una petición de datos al portal de datos abiertos?
https://datos.gob.es/es/informa-sobre/peticion-datos

¿El esquema del csv que comenta @franloza sería suficiente o hace falta algo más?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
help wanted Extra attention is needed
Projects
None yet
Development

No branches or pull requests

5 participants