Ce repository contient pour l'instant tout le travail effectué par moi même et mon binôme Vincent de Germiny sur un projet de 2e année de Master au CERI avec comme sujet le traitement automatique du langage naturel et la classification automatique.
Le but du sujet était de faire de la classification avec comme base le débat entre Emmanuel Macron et Marine Le Pen lors du second tour des élections présidentielles françaises de 2017.
Le document Natural Language Procesing.pdf est un rapport sous forme de revue scientifique parlant du déroulement du projet et des résultats obtenus.
Les script résultant de ce projet sont à usage spécifique à ce sujet, mais les mêmes procédés et technologies peuvent permettre de traiter d'autres corpus.