Habilitation à diriger des recherches

Soutenance

Cette page est dédiée à la soutenance de mon habilitation à diriger des recherches, intitulée Proximity, Similarity and Heredity: From Bioinformatics to Digital Humanities (Proximité, similarité et hérédité : de la bioinformatique aux humanités numériques), devant un jury constitué d'Olivier Kraif (professeur des universités à l'Université Grenoble Alpes, rapporteur), Gregory Kucherov (directeur de recherche CNRS, examinateur), Glenn Roe (professeur des universités à Sorbonne Université, examinateur), Marie-France Sagot (directrice de recherche Inria, rapportrice), Katherine St. John (professor à la City University of New York, rapportrice), Hélène Touzet (directrice de recherche CNRS, examinatrice).

Ajout du 29/10/2024 : diaporama de soutenance, vidéo de la présentation.

Cette soutenance se déroulera en anglais, dans la salle de séminaire 4B125 du LIGM, dans le bâtiment Copernic de l'Université Gustave Eiffel, au 5 boulevard Descartes à Champs-sur-Marne, le lundi 28 octobre 2024 à partir de 14h30.

Pour y participer sur place, merci de vous inscrire dans ce formulaire.

Dans la mesure du possible, un lien sera fourni sur cette page, au plus tard le 28 octobre 2024 à partir de 14h25 pour suivre la soutenance en vidéo, sur Zoom (mdp : G0dmcNU5).

Informations pratiques

Pour atteindre le campus de la Cité Descartes, empruntez depuis Paris le RER A allant en direction de Marne-la-Vallée ou de Torcy en vous plaçant en tête de train, et descendez à l'arrêt Noisy-Champs, en prenant sur votre droite, après les portiques, pour sortir vers la Cité Descartes. Cette carte vous indique ensuite comment atteindre le bâtiment Copernic.

Habilitation dissertation

Mémoire d'habilitation à diriger des recherches

Version la plus récente du mémoire / Latest version of the dissertation

Dossier de travaux (sélection de 10 articles) / Selection of 10 research articles

Abstract

This habilitation thesis gathers several studies in computer science on the notions of proximity, similarity and heredity, with applications in bioinformatics and in digital humanities.
The first part covers phylogenetic networks, which, reconstructed from similarities between biological data, make it possible to model complex hereditary relationships between biological species. Algorithmic solutions to reconstruction and characterization problems are presented, along with properties related to the counting of these networks or their components.
The second part proposes several proximity-based data mining approaches that can be mobilized in digital humanities, in particular through network partitioning, word tree construction or the detection of temporal proximities in text corpora.
The third part presents several methods for analyzing the heredity relationships between several texts, by aligning them at different scales, detecting intertextual relationships, or studying several versions at different successive states of the language.
This work illustrates the possibility of adapting to digital humanities methods and algorithms inspired by bioinformatics, as well as the interest of using simple digital models such as sequences, trees or networks to propose new methodologies for textual data analysis.

Résumé

Ce mémoire d'habilitation à diriger des recherches réunit plusieurs travaux en informatique sur les notions de proximité, de similarité et d'hérédité, avec des applications en bioinformatique et en humanités numériques.
La première partie est dédiée aux réseaux phylogénétiques, qui, reconstruits à partir de similarités entre données biologiques, permettent de modéliser des relations d'hérédité complexes entre espèces biologiques. Des solutions algorithmiques à des problèmes de reconstruction et de caractérisation et des propriétés liées au comptage de ces réseaux ou de leurs composants sont présentées.
La deuxième partie propose plusieurs approches d'exploration de données fondées sur leur proximité qui peuvent être mobilisées en humanités numériques, en particulier par du partitionnement de réseaux, la construction d'arbres de mots ou la détection de proximités temporelles dans des corpus de textes.
La troisième partie présente plusieurs méthodes visant à analyser les relations d'hérédité entre plusieurs textes, qu'il s'agisse de les aligner à diverses échelles, d'y détecter des relations d'intertextualité, ou d'en étudier plusieurs versions à divers états successifs de la langue.
Ce travail illustre la possibilité d'adapter aux humanités numériques des méthodes et algorithmes inspirés par la bioinformatique, ainsi que l'intérêt de se fonder sur des modèles informatiques simples de séquences, d'arbres ou de réseaux, pour proposer de nouvelles méthodologies d'analyse ou de visualisation de données textuelles.

Une autre occasion de découvrir certains de mes travaux récents

J'interviendrai en visio, le mardi 29 octobre 2024, de 13h à 14h, lors du WikiCafé du projet Wikifier la science, sur le thème « Littérature et humanités numériques : la recherche avec le projet Wikisource ».