Programme

Classes d'automates finis et opérations algorithmiques fondamentales pour le traitement des textes en langues naturelles. Reconnaissance approximative d'une séquence par un automate; application à la détection et à la correction d'erreurs. Levée d'ambiguïtés lexicales : objectifs, problèmes linguistiques, propriétés des formalismes, écriture de grammaires de levée d'ambiguïtés, le système Elag. Compression des dictionnaires. Segmentation de la parole: alignements rationnels et transducteurs finis. Phonétisation de mots inconnus: transductions rationnelles, fonctions rationnelles, bimachines, le système BiPho, écriture de règles phonologiques.
Génération automatique : on présente une méthodologie pour aborder l'étude du discours dans le cadre computationnel ainsi que les problèmes soulevés par la modularisation d'un système de génération automatique. Dans l'ensemble des phénomènes de discours, on examinera plus particulièrement les connecteurs qui permettent d'enchaîner deux phrases ou plus. Un formalisme de génération, G-TAG inspiré de TAG, est présenté.