Web scraper per deputati e senatori della repubblica italiana

Setup

Installa le dipendenze python con:

$ pip install -r requirements.txt

Esegui:

$ python main.py

Per lanciare lo scraper.

Lo script main.py crea, nella sua stessa cartella, il file deputati.csv, che contiene, separati da virgole e in questo ordine:

Tali dati sono estratti da https://www.camera.it/leg18/28 e dalle pagine personali dei deputati agli indirizzi https://scrivi.camera.it/scrivi?dest=deputato&id_aul=id dove id è l'id del deputato di cui sopra.

Nella repo sono presenti il file Dockefile e docker-compose.yaml per avviare docker e compose.

$ docker compose up -d

⚠️ In base alla versione di docker in uso è forse necessario usare il comando docker-compose up -d

Con il container in esecuzione è possibile controllare lo stato di avvanzamento con:

$ docker attach scraper

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
docker-compose.yaml		docker-compose.yaml
main.py		main.py
requirements.txt		requirements.txt
utils.py		utils.py