Scrapper de los boletines oficiales publicados por el Gobierno de la Provincia de Córdoba
Switch branches/tags
Nothing to show
Clone or download
Pull request Compare This branch is 52 commits ahead of pdelboca:master.
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Failed to load latest commit information.
boescraper
migrations
tmp/full
webapp
.gitignore
.s3_website.yaml
Procfile
README.md
app.py
main.py
requirements.txt
scrapinghub.yml
scrapy.cfg
setup.py

README.md

Scrapper de los Boletines Oficiales de la Provincia de Cordoba

Scrapper para descargar todos los boletines oficiales de la página del Gobierno de la Provincia de Córdoba.

Scraper

Crear una base de datos llamada boletin. Iniciar schema con

$ ./main.py init_db

y luego correr el scraper con

$ scrapy crawl boe

Website

Correr con

$ FLASK_APP=app.py flask run

Build

Para construir el sitio estático, correr

$ python app.py

con lo que el sitio será construido en webapp/build

Deploy

Con las credenciales de aws en algún lugar accesible a boto3, correr:

$ s3-deploy-website

Heroku

$ heroku apps:create boletin-cba
$ heroku addons:create heroku-postgresql:hobby-dev -a boletin-cba