Skip to content

clement-plancq/outils-corpus

Repository files navigation

Outils de traitement de corpus — Master Plurital

Pratique

6 séances les lundis de 9h à 12h sur le discord plurital salon #outils-corpus-m1.
Les lundis 15 mars, 29 mars et 3 mai nous aurons également l'amphi 7 de l'INALCO, PLC, 65 rue des grands moulins, 75013 Paris.

Évaluation

Un devoir à rendre après chaque séance, sauf la dernière.
6 séances, 5 devoirs, 5 notes. La note finale sera la moyenne des notes.

Tous vos devoirs devront m'être parvenus avant le 17 mai 2021.

Vous pouvez vérifier que j'ai bien reçu vos devoirs sur cette page

Séances

15 mars 2021 (amphi7)

22 mars 2021

29 mars 2021 (amphi 7)

  • Graphes, Grew, Spacy

  • notebook

  • devoirs :

    • Avec Grew-match, trouvez dans le corpus UD_French-Sequoia@2.5 :

      • tous les triplets sujet, verbe, objet
      • les phrases avec sujets inversés
        Vous me rendez deux requêtes (dans le corps de mail ou un fichier txt)
    • Avec l'aide du module Spacy, extrayez les triplets (sujet, verbe, objet) des phrases suivantes et commentez les éventuelles erreurs ou manques.

      « Les enfants n'aiment pas trop les asperges. »
      « Les Français réclament moins d'impôts. »
      « Les acacias donnent un miel ambré, limpide et fluide. »
      « L'équipe fait porter le chapeau à l'arbitrage. »
      « Des nuées de milliards d'insectes, venus de la péninsule Arabique, s'abattent sur la Corne de l'Afrique et dévorent les cultures, mettant en péril la sécurité alimentaire de la région. »
      Vous me rendez le notebook completé ou un script Python commenté

12 avril 2021

  • Notebook de prise en main de Spacy
  • Devoir :
    À l'aide de la bibliothèque Spacy vous relèverez les personnages mentionnés dans Le ventre de Paris.
    Pour chacun des personnages qui apparaissent au moins trois fois, vous indiquerez les verbes dont ils sont sujet.

3 mai 2021 (amphi 7)

10 mai 2021

Pas de devoirs pour cette séance 🥳

Références

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published