Cette action transverse fait converger des approches complémentaires existantes au sein du laboratoire dans le domaine des technologies du langage, dont les verrous actuels au niveau des modèles de fondation, de la collecte de corpus, de la linguistique computationnelle ou de l'interaction humain machine
se retrouvent abordés à différents niveaux dans les pôles et équipes.
L’un des thèmes de recherche représentés au sein du pôle INTERACTION est celui de l’IA incarnée. Ce sujet est abordé au travers d'approches centrées utilisateurs, que ce soit pour la collecte de corpus ou la spécialisation de modèles d'IA existants. Les développements se nourrissent de la recherche en sciences humaines et sociales, et peuvent y contribuer en retour. Les projets ont le plus souvent une forte dimension multidisciplinaire.
Ce thème comprend la spécialisation de modèles et le développement d’algorithmes destinés à favoriser l’interaction humain–agent (agent virtuel ou robot) par le dialogue, comme dans un projet mené conjointement par les équipes RAMBO et COMMEDIA.
L’équipe COMMEDIA est également impliquée dans plusieurs projets portant sur le traitement automatique de documents textuels et de la parole pour en extraire des aspects sémantiques et pragmatiques. Ainsi, des travaux portent sur l'analyse des erreurs produites par les modèles de simplification de texte à travers l’élaboration d’une taxonomie, la constitution de données annotées et la définition de métriques pour évaluer la simplicité textuelle. D'autres travaux portent sur la reconnaissance de l’intention communicationnelle dans les documents multimédia via une analyse narrative. L’équipe participe également au projet JOKER, axé sur la détection et l’aide à la traduction de l’humour, coordonné par le laboratoire HCTI. Par ailleurs, COMMEDIA mène une collaboration interdisciplinaire avec l'université de Bangor, le laboratoire CNRS MoDyCo et le laboratoire CNRS IKER, visant à développer des cadres d’évaluation pour l’IA appliquée aux langues brittoniques, notamment pour le traitement de la parole dans ce contexte
de langues minorisées.
Contact : Anne-Gwenn BOSSER
Le Traitement Automatique de la Langue (TAL) est au cœur des préoccupations de l’équipe DECIDE du pôle DMID, dont les activités s’étendent « des données à la décision ». Au sein d’une chaîne d’analyse de données, le rôle du TAL est d’assurer une compréhension précise et fine, par la machine, de données de type langage naturel que ce soit dans la modalité écrite ou orale. Des techniques telles que l’extraction de connaissances permettent de convertir le langage naturel en représentations formelles, précises et non-ambiguës, directement utilisables par des algorithmes d’inférence ou de prédiction. Au sein de DECIDE sont privilégiées les méthodes de TAL explicables et « pilotables », en particulier pour les domaines critiques d’un point de vue de précision, comme le traitement de données de santé. L’analyse de corpus linguistiques en santé mentale et le traitement des carnets de santé sont des exemples de projets menés par les membres de l’équipe.
Au-delà de l’analyse de données, l’équipe porte un fort intérêt à la linguistique computationnelle et aux problèmes de multilinguisme, c’est-à-dire au TAL capable de supporter une diversité de langues présentant parfois de fortes variances en termes de grammaire, de lexique, de système d’écriture, etc. Les applications de ces recherches s’étendent des humanités numériques, à travers le support des langues minoritaires et peu dotées en ressources, jusqu’à l’étude des biais structurels au sein des systèmes IA (au sens large) envers ou à l’encontre de certaines langues. Dans ce sens, les travaux portés sur les langues celtes par des membres de COMMEDIA créent des opportunités de collaboration entre équipes.
Enfin, le colloque biennal « Grapholingistics in the 21st Century » organisé par des membres de l’équipe, est, depuis 2018, un des seuls évènements scientifiques au niveau mondial à s’intéresser à la modalité écrite de la langue d’un point de vue linguistique mais aussi interdisciplinaire (computationnel, historique, sociolinguistique, artistique, etc.).
Contact: Gábor Bella
De son côté, au sein du pôle T2I3, l’équipe BRAIN consacre ses travaux aux grands modèles de langage (LLMs), en articulant ses contributions autour de quatre axes majeurs : la méthodologie, l'application, la multi-modalité et le raisonnement.
Sur le plan méthodologique, l'équipe œuvre à l'amélioration des performances des LLMs auto-régressifs, notamment par des propositions visant à accroître la diversité de génération textuelle et à optimiser l'alignement entre les entrées et les sorties des modèles. En complément, elle explore des alternatives architecturales solides, telles que les approches de diffusion discrètes. Ces recherches s'accompagnent d'un volet applicatif ciblant spécifiquement le traitement du langage figuré.
L'équipe investigue également la dimension multi-modale en tissant des liens entre le texte et des données hétérogènes comme la vision, l'audio, la musique, ou encore les signaux cérébraux et biologiques. Enfin, l’équipe étudie l'intégration de mécanismes de raisonnement pour faciliter la fouille automatique au sein de grands jeux de données
multi-modaux.
Contact: Vincent Gripon