Una lista di tutorial e strumenti per catturare dati e metadati da cataloghi dei beni librari e culturali del Ministero della Cultura (MiC) che non dispongono di API o di funzioni di download in bulk.
Questo repository è aperto a contributi, ma non si accettano pull request di:
- software proprietari o senza sorgenti
- soluzioni commerciali
- paper non open access
- link a repository che ripubblicano i dati
Tutte le pratiche di seguito elencate hanno come scopo il download di metadati per sole finalità di studio e conservazione offline. Se vengono eseguite attività di scraping è bene farlo in modo poco aggressivo e soprattutto esponendo nello User-Agent delle chiamate HTTP informazioni con i vostri contatti.
- manus-dl Download XML TEI da Manus
- ic-dl Download XML MAG da InternetCulturale
- bncr-emeroteca Download metadati JSON dall'Emeroteca BNCR
- API JSON dell'Opac SBN