Ceci est l'ensemble des résultats obtenus lors la réalisation du projet du cours « Programmation et Projet encadré 2 » dans le cadre de Master 1 Traitement Automatique des Langues.
Le projet vise à apprendre à utiliser les outils nécessaires au traitement d'un corpus composé de l'ensemble des fils RSS disponibles sur le site du journal Le Monde recueillis tous les jours de l'année 2020 à 19h. Nous avons constitué au fil du semestre 3 boîtes à outils réunissant les programmes successifs réalisés pour un traitement complet de notre corpus de travail. Ces programmes ont pour le but les tâches / les traitements suivants :
- Extraction des données textuelles
- Étiquetage des données extraites
- Extraction des données étiquetées
Pour consultez chaque étape de ce projet, veuillez consulter ce site.