L'intégralité du cours et des ressources nécessaires est disponible ici, ce qui inclut :

  • le support de cours ;
  • deux fables de La Fontaine, découpées en mots, pour expérimenter l'analyse morpho-syntaxique ;
  • un script python pour extraire les noms communs du corpus des discours de Nicolas Sarkozy.

La plupart des ressources utilisées lors du corpus précédent seront réexploitées dans ce cours. Les étudiants peuvent ainsi valoriser les connaissances précédemment acquises.

À l'issue de cette seconde séance mon objectif est d'avoir enseigné aux étudiants :

  • des connaissances suffisantes à la compréhension de l'algorithme de Porter ;
  • l'intérêt de l'analyse morphologique pour la compréhension des textes ;
  • l'utilisation de Tree Tagger, un étiqueteur de rôles grammaticaux ;
  • l'intérêt de la catégorisation des mots selon leurs rôles grammaticaux.