Modulo de python que permite descargar información presupuestaria de Presupuesto Abierto. El sitio contiene diversa información presupuestaria desde el ejercicio 1995 a la actualidad.
La motivación para programar este modulo fue la necesidad de contar, de forma sencilla, con series temporales de información presupuestaria. El 'Sitio del ciudadano' permite descargar año por año, pero no una base con una serie temporal que incluya varios ejercicios.
Pysupuesto, mediante get_data
descarga, por el momento, información de crédito y su ejecución, y de recursos. De periodicidad anual, mensual y diaria (según el periodo).
Tambien, utilizando get_docs
, muestra los recursos (en términos de información) disponibles para cada año, por si es necesario descargar manualmente información complementaria.
- Python 3.8
- beautifulsoup4=>4.10.0
- bs4=>0.0.1
- pandas=>1.3.3
pip install pysupuesto
import pysupuesto
df = pysupuesto.get_data('tipo', 'periodicidad', ejercicio inicio, ejercicio cierre)
Donde:
tipo
: Por el momento, sólo toma dos valoresrecursos
: Devuelve los recursos presupeustarios.credito
: Devuelve la ejecución presupuestaria.
periodicidad
: Dependiendo el año, puede ser:a
: Anual (desde 1995 a 2021)m
: Mensual (desde 1995 a 2021)d
: Diaria (desde 2017 a 2021)
ejercicio inicio
: Ejercicio desde el cual se quiere descargar la informaciónejercicio cierre
: Hasta el ejercicio hasta el cual se quiere descargar información. Puede omitirse para sólo descargar 'ejercicio inicio'.
La información es descargada a un dataframe (llamado df
en el ejemplo).
Descargar la información del crédito presupuestario y su ejecución del ejercicio 2018, con periodicidad diaria:
df = pysupuesto.get_data('credito','d', 2018)
Descargar la información del crédito presupuestario y su ejecución desde el ejercicio 1995 al 2021, con periodicidad anual:
df = pysupuesto.get_data('credito','a', 1995,2021)
Descargar la información de recursos presupuestarios del ejercicio 1997, con periodicidad mensual:
df = pysupuesto.get_data('recursos','m', 1997)
Descargar la información de recursos presupuestarios desde el ejercicio 2001 al ejercicio 2005, con periodicidad anual:
df = pysupuesto.get_data('recursos','a', 2001, 2005)
pysupuesto.get_docs(ejercicio)
Devuelve un print con todos los archivos disponibles para ese ejercicio.
Empaquetar y compartir en pypi para que esté disponible mediantepip install
- Mejorar el sistema de logs.
- Intentar analizar toda la información disponible (para eso cree
get_docs
) para expandir el modulo y poner a disposición mayor cantidad descargas.