ISPRA pubblica in questa pagina https://www.catasto-rifiuti.isprambiente.it/index.php?pg=downloadComune i dati comunali di produzione e raccolta differenziata sui Rifiuti Urbani, in file con raccolte annuali (ad oggi) dal 2010 al 2017. Sono pubblicati in formato ods
(foglio di calcolo in formato open document).
In questo repo uno script per scaricarli, pulirli, ristrutturarli e convertirli in un unico CSV e per l'appunto il file di insieme.
NOTA BENE:
- il campo
PERCRD
del file CSV di output esprime le percentuali in valori divisi per 100, quindi0.67
equivale al67%
; - sul sito sorgente, i dati sono stati pubblicati in CSV e non più in in formato open document. Quindi lo script non è più utilizabile.
È scritto in bash e sfrutta queste utility:
- scrape, per estrarre gli URL degli ODS via XPATH https://github.com/aborruso/scrape-cli/releases
- pyexcel, per convertire fogli elettronici in CSV https://github.com/pyexcel/pyexcel
- pyexcel-ods, estende pyexcel per abilitare la conversione di file
ods
https://github.com/pyexcel/pyexcel-ods - Miller, nella sua versione da compilare come indicato qui, in modo da avere una comoda funzione non disponibile ancora nella versione in produzione.
Si occupa di:
- fare il download dei file
ods
; - convertirli in
csv
; - rimuovere un'inutile riga di intestazione;
- rimuovere spazi bianchi in più (come
Piemonte • • •
) e righe vuote; - gestire il cambio di ordine e numero di campi che avviene al passaggio dall'anno 2015 al 2016;
- aggiungere il campo con l'anno;
- fare il merge in unico file
csv
di output.