Skip to content
master
Switch branches/tags
Code

Latest commit

 

Git stats

Files

Permalink
Failed to load latest commit information.
Type
Name
Latest commit message
Commit time
R
 
 
 
 
 
 
py
 
 
 
 
 
 

upem-topic-modeling

Cours sur le topic modeling - UPEM - Master Méthode computationnelle et analyse de contenu

I: Topic Modeling

  • Nature et applications
  • Approche Deterministe: LSA
  • Approche Probabiliste: LDA
  • Quelques librairies en R et python

II: Le package STM en R

  • Parametres
  • Métriques: exclusivité et cohérence sémantique
  • Appliqué a un corpus propre

LAB - R STM

  • Le corpus: résumés d'articles tech, IEEE et Arstechnica
  • Le package STM en R
  • Comment determiner le nombre optimal de topics?
  • Comment interpreter les résultats?
  • Jupyter Notebook et Script R

III: forum Alt-right sur Facebook

  • 500.000 commentaires provenant du forum alt-right God Trump Emperor
  • De la nécessité de travailler le contenu
  • Filtrer le bruit avec
    • Lemmatization, tokenization
    • Part of Speech tagging
    • Named entity recognition
  • Jupyter Notebook et Script R

IV: Application au Francais

  • Quelles sont les librairies pour:
    • Part of Speech
    • Tokenization
    • Lemmatization

V: Resources

  • Articles et blogs

About

Cours sur le topic modeling - UPEM - Master Méthode computationnelle et analyse de contenu

Resources

Releases

No releases published

Packages

No packages published