PhD Defense Gustave Cortal

Traitement automatique des langues pour l'analyse de la subjectivité dans les récits personnels

Mardi 27 janvier 2026 à 14h00
Salle 1B36 - Amphithéâtre Simondon, 4 Av. des Sciences, 91190 Gif-sur-Yvette and online

Résumé : Les récits personnels sont des histoires que les individus racontent sur leurs propres vécus, et qui donnent à voir leurs pensées, sentiments et perceptions. Cette thèse explore des manières de modéliser l'expérience subjective dans les récits personnels à travers le traitement automatique des langues. Nous ancrons d'abord l'analyse des émotions dans les sciences cognitives : nous passons en revue les principales théories des émotions et les relions aux pratiques d'annotation dominantes. De cette synthèse émergent des pistes concrètes pour améliorer les modèles de langue, qu'il s'agisse de nouveaux schémas d'annotation, de méthodologies ou de jeux d'évaluation.

Pour mettre ces idées en pratique, nous concevons des jeux de données et des modèles de langue dédiés à l'analyse des émotions. Premièrement, afin d'obtenir une vision plus complète des événements émotionnels, nous construisons un corpus français de récits émotionnels structuré selon plusieurs composantes psychologiques (comportements, ressentis et pensées). L'étude des interactions entre composantes montre que chacune contribue à la classification des émotions, avec des performances maximales lorsque toutes sont prises conjointement.

L'examen des corpus d'émotions met en évidence un manque pour les récits de rêves : les collections sont volumineuses, mais les labels restent rares. Pour accélérer l'analyse quantitative des rêves, nous automatisons l'annotation dans le corpus DreamBank à l'aide d'un cadre séquence-à-séquence pour la détection des personnages et des émotions. Pour mieux comprendre les performances, nous étudions l'effet de la taille des modèles, de l'ordre de prédiction des personnages et du rôle des noms propres et des traits.

Enfin, nous passons du contenu à la forme en considérant le style comme un indicateur de la manière dont l'expérience subjective s'exprime linguistiquement. Nous opérationnalisons le style comme des motifs séquentiels de choix linguistiques dans des récits personnels, en combinant linguistique fonctionnelle, fouille de motifs et interprétation psychologique. À l'aide de modèles de langue, nous appliquons ce cadre à des centaines de rêves, dont une étude de cas centrée sur un vétéran de guerre atteint d'un trouble de stress post-traumatique.

La thèse a été dirigée par Alain FINKEL et co-encadrée par Patrick PAROUBEK et Lina YE.

Jury :

  • Chloé CLAVEL, Directrice de recherche, Inria Paris, Université PSL (Rapporteure)
  • Frédéric BÉCHET, Professeur des universités, Université d'Aix-Marseille (Rapporteur)
  • Delphine BATTISTELLI, Professeure des universités, Université Paris Nanterre (Examinatrice)
  • Frédéric BOULANGER, Professeur, Université Paris-Saclay (Examinateur)
  • Guillaume DUMAS, Professeur agrégé, Université de Montréal (Examinateur)
  • Brian RAVENET, Maître de conférences, Université Paris-Saclay (Examinateur)