Lexique 3 est une base de données qui fournit pour 135000 mots du français de nombreuses informations linguistiques ici au format SQL
Switch branches/tags
Nothing to show
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Failed to load latest commit information.
README.md
lexique.sql

README.md

Lexique SQL

Lexique 3 est une base de données qui fournit pour 135000 mots du français de nombreuses informations linguistiques. Elle est présentée ici au format SQL, plus adaptée que le format texte pour une utilisation avec des requêtes.

Informations

La liste des informations disponibles dans la base est détaillée dans la documentation de Lexique 3. Les tables comprennent, outre les mots, les lemmes, les fréquences, le genre, le nombre, la catégorie grammaticale, et de nombreuses représentations orthographiques, phonémiques et syllabiques, etc.

Format

La base de données Lexique 3 est disponible sur le site officiel aux formats texte et Excel. En revanche, ces formats ne sont pas très pratiques pour des applications web qui reposent sur des requêtes, j'ai donc trouvé la même base réenregistrée au format SQLite, et pour mes besoins personnels je l'ai réadapté pour une utilisation dans ma base MySQL, donc au format SQL classique.

Exemples d'utilisation

L'application "Si à la Saint-Valentin on te tient la main…" sur mon site repose uniquement sur Lexique 3 en faisant des inférences de rimes en fonction de la fin du nom donné.

Lexique 3 est également la base de données sur laquelle repose la base de données de rimes Drime crée par Antoine Amarilli (a3nm), utilisée dans plusieurs de mes applications.

Le programme Fréquences des mots est une implémentation naïve et brutale de requêtes des mots d'un texte sur la base Lexique pour obtenir leurs fréquences.