ESR lexicon permet de constituer des dictionnaires d'entités nommées relatifs aux structures de recherche françaises :
- Établissements de l'ESR (libellés, sigles)
- Laboratoires de recherche (libellés, sigles)
- Autres structures de recherche (libellés, sigles)
- Écoles doctorales
- Noms et prénoms des chercheurs
- Noms des unités de recherche
- Noms des départements de recherche
ESR lexicon récupère ses informations depuis HAL et ScanR.
ESR lexicon est précompilé pour Linux et Mac.
$ ./esr-lexicon -h
ESR lexicon 0.2.0
Mathis EON. <eon@abes.fr>
Build NER dictionaries
USAGE:
esr-lexicon [FLAGS] --config <FILE> --file <FILE> --jq <EXPRESSION> --output <FILE> --url <URL>
FLAGS:
-h, --help Prints help information
-s, --silent Silent output
-V, --version Prints version information
OPTIONS:
-c, --config <FILE> Sets a custom config file
-f, --file <FILE> Input file
-j, --jq <EXPRESSION> Expression used for parsing data
-o, --output <FILE> Output file
-u, --url <URL> Input URL
En utilisant un fichier de configuration
./esr-lexicon -c config.json
En ligne de commande exclusivement
./esr-lexicon -o scanr.structure.recherche -j '.["facet_groups"][0]["facets"]|map([.["name"]])| .[] | @tsv' -u "https://data.enseignementsup-recherche.gouv.fr/api/records/1.0/search/?dataset=fr-esr-repertoire-national-structures-recherche&rows=0&facet=libelle"
ESR lexicon utilise des expressions jq pour extraire les données json.
ERS lexicon suit automatiquement les curseurs SolR pour les requêtes utilisant la pagination avec cursorMark=*
.