puobot je web robot koji radi katalog PUO i SPUO postupaka nadležnog ministarstva za zaštitu okoliša i prirode RH. Powering Robo-MZOIP.
Dokumenti o postupcima procjene utjecaja na okoliš na web stranici nadležnog ministarstva za zaštitu okoliša i prirode se dodaju na način da je nemoguće sustavno i redovito pratiti objave novih dokumenata.
Web scraper koji redovito prati nove dodane dokumente i radi katalog zahvata i dokumenata, te po potrebi nove zahvate objavljuje putem twitter-a.
python3 puobot.py [--twitter 1]
Za twitter funkcionalnost potrebno je imati Twitter oauth podatke u zasebnim redovima u datoteci /input/twit_api_key.txt
.
twit_api_key.txt
:
[API Key]
[API Secret]
[Access token]
[Access token secret]
Svi pronađeni dokumenti pospremaju se u arhivu u zasebne .tsv
datoteke:
puo.tsv
- PUO postupci (procjena utjecaja na okoliš)puo_pg.tsv
- Prekogranični PUO postupciopuo.tsv
- OPUO postupci (ocjena o potrebi procjene utjecaja na okoliš, "screening")spuo_min.tsv
- SPUO postupci za koje je nadležno Ministarstvo (strateška procjena utjecaja na okoliš)spuo_jlrs.tsv
- SPUO postupci za koje su nadležna druga upravna tijela (npr. JLRS) (strateška procjena utjecaja na okoliš)spuo_pg.tsv
- Prekogranični SPUO postupciospuo.tsv
- OSPUO (ocjena o potrebi strateške procjene, "screening")
Sve razlike između posljednje verzije arhive spremljene u output/
folderu ispisuju se na standardni output (konzolu)
- Python 3
- requests (2.12.4)
- BeautifulSoup4 (4.5.3)
- lxml parser (3.7.2)
- scraperwiki (0.5.1)
- twython