Skip to content
Cours sur le topic modeling - UPEM - Master Méthode computationnelle et analyse de contenu
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
R
data
images
py
.gitignore
README.md
UPEM-Topic_modeling.pdf
UPEM-Topic_modeling.pptx

README.md

upem-topic-modeling

Cours sur le topic modeling - UPEM - Master Méthode computationnelle et analyse de contenu

I: Topic Modeling

  • Nature et applications
  • Approche Deterministe: LSA
  • Approche Probabiliste: LDA
  • Quelques librairies en R et python

II: Le package STM en R

  • Parametres
  • Métriques: exclusivité et cohérence sémantique
  • Appliqué a un corpus propre

LAB - R STM

  • Le corpus: résumés d'articles tech, IEEE et Arstechnica
  • Le package STM en R
  • Comment determiner le nombre optimal de topics?
  • Comment interpreter les résultats?
  • Jupyter Notebook et Script R

III: forum Alt-right sur Facebook

  • 500.000 commentaires provenant du forum alt-right God Trump Emperor
  • De la nécessité de travailler le contenu
  • Filtrer le bruit avec
    • Lemmatization, tokenization
    • Part of Speech tagging
    • Named entity recognition
  • Jupyter Notebook et Script R

IV: Application au Francais

  • Quelles sont les librairies pour:
    • Part of Speech
    • Tokenization
    • Lemmatization

V: Resources

  • Articles et blogs
You can’t perform that action at this time.