Skip to content

mariaclaudia/Strade900Piemonte

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Il 900 in Piemonte: una strada alla volta

https://datavizpiemonte2017.github.io/Strade900Piemonte/

Spesso ogni giorno percorriamo vie attribuite a persone di cui non sappiamo nulla ma che sicuramente hanno scritto pagine importanti di storia italiana e piemontese.

Il nostro progetto è nato con l'intento di diventare uno strumento didattico: abbiamo scelto i capoluoghi di provinca del Piemonte e tramite strumenti open source e data set pubblici abbiamo cercato di dare un volto alle persone ed eventi a cui sono intestate le vie delle nostre città.

In particolare modo abbiamo voluto dare risalto alle donne e agli uomini che hanno vissuto nel '900 ma allo stesso tempo abbiamo deciso di mantere tutte le personalità che hanno vissuto nei secoli precedenti.

Sulla mappa sono possibili due tipi di visualizzazioni:

  • le strade dedicate unicamente a personaggi significativi per il '900
  • le strade dedicate a tutte le persone vissute nei secoli precedenti

Per la suddivisione abbiamo usato quella suggerita da "Storia d'Italia di Montanelli" https://it.wikipedia.org/wiki/Storia_d%27Italia_(Montanelli))

Fin dall'inizio non ci aspettavamo che tutte le vie sarebbero state identificate o che la persona giusta venisse assegnata ad ogni strada. Consapevoli dei limiti del nostro approccio, e curiosi di vederne il risultato, la nostra priorità era usare dati aperti (le informazioni geografiche di OpenStreetMap e quelle biografiche di Wikipedia e Wikidata) per creare uno stradario tanto imperfetto quanto facilmente riproducibile. Potendo continuare ci piacerebbe renderlo piu' interattivo, permettendo agli utenti di fornire dei feedback sugli abbinamenti via-persona (siamo abbastanza sicuri che la via Fossati di Torino non si riferisca a Ivano Fossati bensì al Cardinale Maria Fossati) e aggiungere delle informazioni sugli eventi storici (evidenziati in nero per mancanza di dati strutturati sugli anni).

In questo progetto sono stati utlizzati unicamente software opensource e dati aperti.

Data Pipeline

Si è deciso di limitare l'analisi alle città capoluogo del Piemonte.

Per la realizzazione della Pipeline è stato usato python tramite iPython notebook.

Inizialmente per creare una data pipeline completamente dinamcia si è utilizzato Overpass API per interrogare Open Street Map Successivamente abbiamo deciso di utilizzare gli estratti messi a disposizione dalla comunità OSM. http://osm-estratti.wmflabs.org/estratti/ Per convertire gli estratti in file geoJson è stato utilizzato il tool ogr2ogr che converte da formato shp in geojson Una via può essere composta da più id e quindi necessario crearsi una tabella di lookup tra Nome via e ID che compongono la via

Per ogni città abbiamo ripulito i nomi della strade utilizzando dei token (es.Via, Piazza, Corso...) individuati tramite un'analisi fatta su tutti i nomi delle strade dei capoluoghi.

Per ogni nome via ci siamo affidati al motore di ricerca Google per capire per capire se si trattatva di qualcosa/qualcuno di significativo. Se tra i primi 5 risultati restituiti dalla chiamata a Google c'è un risultato di WIKIPEDIA questo ci sembrava sufficientemente

Inizialmente abbiamo utilizzato WikiData tramite delle Query SPARQL, poi abbiamo preferito l'uso di Scrapy direttamente nella pagina Wikipedia accessible tramite l'URL restituita precedentemente. Grazie alla libreria Scrapy abbiamo abbinato ai dati geografici delle vie le informazioni utili trovate nella pagina di Wikipedia nel caso si tratti di un'entità Human or Data.

Il risultato finale della pipeline è un file GEOJSON per capoluogo di provincia contenente tutti gli id abbinati ad una via/piazza/ il cui nome è presente in Wikipedia.

Nella cartella DATA sono contenuti anche i dataseto GeoJson originali prodotti da OSM.

Statistiche

Alessandria: 746 vie di cui 522 entità individuabili su wikipedia.

Asti: 522 vie di cui 483 entità individuabili su wikipedia

Biella: 527 331 entità individuabili su wikipedia

Cuneo: 412 di cui 289 entità individuabili su wikipedia

Novara: 840 716 entità individuabili su wikipedia

Torino: 3999 vie di cui 2815 individuabili su wikipedia

Verbania: 414 vie di cui 226 individuabili su wikipedia

Vercelli: 552 vie di cui 489 individuabili su wikipedia

Per via si intendono anche piazze, viali, corsi...

Osservazioni

Ci sono alcune aspetti sicuramente migliorabili, ad esempio la categorizzazione delle vie composte da delle date: in wikipedia non è presente l'evento storico specifico ma la ricerca ti restituisce una pagina con i vari significato ed eventi legati a quella data

Es: 2 giugno: https://it.wikipedia.org/wiki/2_giugno L'URL corretta sarebbe: https://it.wikipedia.org/wiki/Festa_della_Repubblica_Italiana

Tools

  • IPython Notebook - The IPython Notebook is now known as the Jupyter Notebook. It is an interactive computational environment, in which you can combine code execution, rich text, mathematics, plots and rich media.
  • Leaflet - an open-source JavaScript library for mobile-friendly interactive maps
  • D3 - D3 is a JavaScript library for visualizing data with HTML, SVG, and CSS.
  • Github pages - Websites for you and your projects, hosted directly from your GitHub repository. Just edit, push, and your changes are live.
  • Google API
  • Scrapy - An open source and collaborative framework for extracting the data you need from websites. In a fast, simple, yet extensible way.
  • ogr2ogr From SHP ti GeoJson file

Vuoi contribuire

Per informazioni piu' dettagliate e per mettervi in contatto con noi potete visitare il repository di Github.

Autori

Licenza

Creative Commons Attribuzione e Condivisione allo stesso modo (CC:BY-SA)

Ringraziamenti

Un ringraziamento a Napo per i consigli e le dritte su OSM e dintorni.

Releases

No releases published

Packages

No packages published

Languages

  • JavaScript 92.4%
  • CSS 6.4%
  • HTML 1.2%