No description, website, or topics provided.
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
README.md
monument_histo_ge.csv
monuments_histo_strasbourg.csv
scraper_monu_histo_ge.py
scraper_monu_histo_strasbourg.py
scraper_wikipedia_py3.py

README.md

Scrapers des monuments historiques sur Wikipedia

Ces deux scripts codés en Python permettent d'ordonner dans des CSV les principales informations de pages Wikipedia consacrées aux monuments historiques (Strasbourg et principales villes du Grand-Est).

L'objectif est grosso modo de se retrouver avec un fichier qui est traduisible par QGis :

CSV_QGis

Ces scripts utilisent les modules urllib, BeautifulSoup, re et csv. A noter que leurs premières versions ont été codées sous une distribution Debian, donc pas avec la dernière version de Python.

Les recettes sont détaillées sur ce blog !

EDIT : j'ai ajouté une version qui tourne sur Python 3. Pour gérer plus efficacement l'encodage, j'ai préféré requests à urllib !