Skip to content

ludovicmoncla/demo-perdido-egc-2023

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

64 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

EGC 2023

Démonstration - Perdido Geoparser - EGC 2023

Cette démonstration présente la librairie Python Perdido pour le geoparsing et le geocoding de textes en français. Nous montrons en particulier comment utiliser Perdido pour la reconnaissance des entités nommées (Named Entity Recognition) et la résolution de toponymes (Geocoding).

Nous expérimenterons le geoparsing et le geocoding au travers deux études de cas : le traitement d'articles encyclopédiques (corpus issu du projet GEODE) et le traitement de descriptions de randonnées (corpus issu du projet ANR CHOUCAS).

Auteurs : Ludovic Moncla (Univ Lyon, INSA Lyon, CNRS, UCBL, LIRIS, UMR 5205, F-69621) Mauro Gaio (Université de Pau et des Pays de l'Adour, CNRS, LMAP, UMR 5142)

Tâches et problématiques abordées

  1. Reconnaissance et classification des entités nommées en français
  2. Créer et afficher une carte à partir d'un texte
  3. Résolution de toponymes (problématique de désambiguïsation)

Vous pouvez exécuter le notebook à distance en utilisant Binder ou Open In Colab. Sinon, pour exécuter ce tutoriel depuis un environnement local sur votre ordinateur, vous pouvez suivre les instructions ci-dessous.

Configurer un environnement Python

Cloner ce dépôt git

git clone https://github.com/ludovicmoncla/demo-perdido-egc-2023.git

Configurer l'environnement avec toutes les dépendances nécessaires

  • Créer un nouvel environnement nommé demo-perdido-egc-py39
conda create -n demo-perdido-egc-py39 python=3.9
  • Activer l'environnement
conda activate demo-perdido-egc-py39
  • Installer le paquet fiona avec conda (évite une erreur lors de l'installation de cette dépendence avec pip)
conda install fiona==1.8.21
  • Installer les dépendances avec pip
pip install -r requirements.txt

Lancer le serveur Jupyter

jupyter notebook

About

Démonstration de la librairie Python Perdido pour le geoparsing et le geocoding de textes en français. Présentée lors de la session démo de la conférence EGC 2023.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published