Accueil>INRIA - Sciences Po : premiers résultats de SaLM

17.07.2025
INRIA - Sciences Po : premiers résultats de SaLM
SaLM (Socially-Aware Language Models) est une action de recherche exploratoire interdisciplinaire menée entre Inria (Paris) et Sciences Po.
Elle vise à repenser les algorithmes de traitement du langage naturel en intégrant les contextes sociaux et culturels dans lesquels les textes et les annotations sont produites. Son objectif est de construire des modèles de langues plus sensibles à la variété des contextes sociaux en mettant en avant l'importance de comprendre le langage en tant que reflet des identités culturelles et sociales.
Trois étudiantes vont réaliser leur thèse sous les auspices du projet SaLM et seront co-encadrées par un ou une spécialiste du traitement automatique des langues chez INRIA et par une sociologue ou un politiste à Sciences Po :
- Célia Nouri (co-encadrée par Chloé Clavel et Jean-Philippe Cointet) développe des modèles personnalisés de modération, en appliquant la théorie pragmatiste du discours aux données des réseaux sociaux et en questionnant les notions classiques de vérité de terrain dans la recherche en TAL
- Sofia de Tremmiolles (co-encadrée par Djamé Seddah et Alexander Kindel / Jean-Philippe Cointet) travaille sur un corpus d’auteurs situés sociologiquement afin de caractériser les motifs linguistiques typiques de certains groupes socio-démographiques
- Cecilia Graiff (co-encadrée par Benoît Sagot et Emiliano Grossman) analyse la dynamique des arguments dans le débat politique à l’aide de grands modèles de langue
SALM organise également des ateliers réguliers permettant à l’équipe de partager les derniers résultats et défis rencontrés, le dernier s’est tenu dans les locaux d’INRIA le 10 juillet 2025).
SaLM contribue ainsi au développement d’un langage et d’une culture commune entre l’INRIA et Sciences Po, essentiels à la structuration d’un partenariat durable.
Parmi les premiers résultats remarquables, Celia Nouri présentera ses travaux sur les dynamiques conversationnelles de l’espace numérique lors du 63ème congrès annuel de l’Association for Computational Linguistics (ACL) qui se tiendra à Vienne du 27 juillet au 1er Août 2025.
Son article complet est disponible ci-après : https://arxiv.org/pdf/2504.01902
Nous contacter
- Directeur : Jean-Philippe Cointet
- Secrétaire générale : Olivier Echegu
- Directrice exécutive TIERED : Marie-Hélène Caitucoli