Skip to content

alexisperrier/upem-topic-modeling

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

upem-topic-modeling

Cours sur le topic modeling - UPEM - Master Méthode computationnelle et analyse de contenu

I: Topic Modeling

  • Nature et applications
  • Approche Deterministe: LSA
  • Approche Probabiliste: LDA
  • Quelques librairies en R et python

II: Le package STM en R

  • Parametres
  • Métriques: exclusivité et cohérence sémantique
  • Appliqué a un corpus propre

LAB - R STM

  • Le corpus: résumés d'articles tech, IEEE et Arstechnica
  • Le package STM en R
  • Comment determiner le nombre optimal de topics?
  • Comment interpreter les résultats?
  • Jupyter Notebook et Script R

III: forum Alt-right sur Facebook

  • 500.000 commentaires provenant du forum alt-right God Trump Emperor
  • De la nécessité de travailler le contenu
  • Filtrer le bruit avec
    • Lemmatization, tokenization
    • Part of Speech tagging
    • Named entity recognition
  • Jupyter Notebook et Script R

IV: Application au Francais

  • Quelles sont les librairies pour:
    • Part of Speech
    • Tokenization
    • Lemmatization

V: Resources

  • Articles et blogs

About

Cours sur le topic modeling - UPEM - Master Méthode computationnelle et analyse de contenu

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published