Projet de Séminaire de Stat'
Dans ce projet on s'intéresse à la création de clusters pour les noeuds d'un graphe. On applique les modèles aux données blog du package mixer. Les deux modèles qu'on utilise sont:
- Stochastic Block Model
- Stochastic Block Model Mixed Membership
Ils sont basés sur les articles de recherche suivants:
-K. Nowicki, T. Snijders, Estimation and prediction for stochastic block- structures, Journal of the American Statistical Association 96 (455) (2001) 1077–1087.
E. Airoldi, D. Blei, S. Fienberg, E. Xing, Mixed membership stochastic blockmodels, The Journal of Machine Learning Research 9 (2008) 1981– 2014.
On appliquera aussi les modèles sur un jeu de données de Twitter, qui est le fruit d'un autre projet (cf. YRussac/French_Presidential_Election_Twitter_Markov_Process). On a choisi de garder les 1000 noeuds les plus centraux au sens du PageRank pour le scrapping effectué le 16 avril 2017.