Skip to content

Nettoyage et enrichissement des données HAL, désambiguïsation des intitulés de conférences

License

Notifications You must be signed in to change notification settings

datactivist/nettoyage_donnees_HAL

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

32 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Nettoyage et enrichissement des données HAL-Inria

Désambiguïsation des intitulés de conférence et ajout du Rank millésimé

Auteur : Diane Thierry, Datactivist

Les intitulés de conférences renseignés dans les données de l'archive ouverte HAL lors du dépôt d'une communication ne sont pas toujours proprement renseignés. Une source de désambiguïsation et d'enrichissement des données est fournie par le référentiel CORE.

Dans ce contexte, Datactivist a conduit une mission pour Inria en janvier 2023, composée de deux phases :

  • désambiguïsation des intitulés de conférence des communications Inria via l'intitulé ou l'acronyme issu de CORE ;
  • ajout du rang (qualifiant la notoriété de la conférence) millésimé, c'est-à-dire le rang valable l'année de la communication.

La synthèse de ce travail est disponible sur ce repository, sous forme de notebook.

About

Nettoyage et enrichissement des données HAL, désambiguïsation des intitulés de conférences

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages