On trouvera ici les premiers éléments méthodologiques des travaux menés avec le Cetop à l'UPF (Avec Pierre Ghewy et Hiriata Brotherson). L'analyse est menée sur le corpus d'un hôtel. L'analyse systématique sur l'ensemble des hôtels et les 4 dernières années (27000 commentaires en français) est menée ici
Les techniques utilisées sont
- Analyse du sentiment (Feel, fr_lexicoder et LIWC)
- LDA
- Analyse des dépendances
- Naive bayes pour la prediction des notes.
- Mesure de la lisibilité et de la diversité lexicale.