Skip to content

cyidhn/texto

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

79 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Texto

Ce projet a été initié par l'équipe du laboratoire IDHN (CY Cergy Paris Université). Il regroupe plusieurs outils et algorithmes développés en Python pour faire des analyses textuelles en français.

Installation

⚠ La librairie de textomĂ©trie est actuellement en cours de dĂ©veloppement actif et n'est pas utilisable pour le moment. Pour les dĂ©veloppeurs Python, rendez-vous dans le dossier "prototypes" pour dĂ©couvrir les algorithmes disponibles ; ceux qui seront intĂ©grĂ©s prochainement dans la librairie texto.

Pour installer la librairie, assurez-vous d'avoir une version de Python >=3.6, puis lancez la commande suivante :

pip install texto

Une fois installée, lancez la commande suivante pour lancer l'application :

texto install

Pour les développeurs souhaitant prototyper ou ajouter leurs algorithmes, il est conseillé de forker ce référentiel, de le cloner, de créer une branche spécifique à votre algorithme, d'effectuer vos modifications dans le code et de faire un pull request sur notre dépÎt. Avant ça, il est fortement recommandé de créer une issue pour discuter des algorithmes que vous souhaitez ajouter ou améliorer.

Les algorithmes en cours d'ajouts

  • GĂ©nĂ©rateur de concordancier (JĂ©rĂ©my Demange)

  • Dispersion du discours (JĂ©rĂ©my Demange)

  • FrĂ©quence des termes (JĂ©rĂ©my Demange)

  • RAMER - Algorithme de topics issu du langage d'indexation RAMEAU de la BNF (JĂ©rĂ©my Demange)

  • Reine - Algorithme semblable Ă  Reinette et Reinert dans Iramuteq (JĂ©rĂ©my Demange)

  • Topic Modeling - Algorithme utilisatant l'allocation de Dirichlet latente (JĂ©rĂ©my Demange)

Citations

Pour toute utilisation de nos algorithmes, merci de citer les auteurs dans d'Ă©ventuelles publications.