ProgrammeNotions linguistiques sur les corpus ; les corpus multilingues et leurs applications ; les principaux outils de traitement de corpus (PERL, étiqueteurs, extracteurs). Les réseaux sémantiques et la terminologie : construction de dictionnaires électroniques, réseaux sémantiques, thésaurus et ontologies ; traitement de la terminologie (extraction et structuration) et les types de variation des termes ; gestion des connaissances, systèmes à base de connaissances, recherche d'informations, construction d'index, indexation de documents, indexation en texte intégral. Des solutions pour le traitement computationnel de l'ambiguïté : désambiguïsation sémantique ; prise en compte de la morphologie et de la catégorie grammaticale ; réduction de l'ambiguïté sémantique par reconnaissance des expressions et mots composés. |