Mathématiques discrètes et algorithmique
Informatique pour la biologie
Informatique pour le traitement
Visualisation
Mes travaux de recherche portent sur l'algorithmique des graphes, avec des applications en bioinformatique et en analyse de corpus textuels.
Je coordonne actuellement les projets de recherche suivants :



PHC Merlion 49631YD (Untangling tanglegrams and applications to chronological document analysis, 2023-2024, budget accordé : 6 000 €) 
Projet « guichet unique » de l'I-Site FUTURE Cité des Dames 2 (De ville en ville: villes et réseaux au prisme des mobilités et circulations féminines, 2024-2026, budget accordé : 60 000 €), coordination avec Caroline Trotot et Claire DelahayeJe participe également au projet de recherche suivant :

Projet « guichet unique » de l'I-Site FUTURE UrbaNature 2 (Entre ville et campagne : évolutions et hybridations, 2024-2026)Par le passé, j'ai coordonné les projets de recherche suivants :

Projet Impulsion de l'I-Site FUTURE Cité des Dames (Créatrices dans la cité - female creators in the city, 2019-2022, budget accordé : 239 644 €), coordination avec Caroline Trotot : [GeoHumanities'20], [CO 2021], [JOHD 2021], [EADH'21a], [EADH'21b]


Délégation CNRS au Lattice « algorithmes inspirés de la bioinformatique pour l'analyse de corpus textuels » (premier semestre 2020/2021, bilan, budget accordé : environ 4 000 € de remboursement d'heures d'enseignement) : [JOHD 2021], [EADH'21a], [EADH'21b], [JoCA 2022]
PEPS CNRS/RNMSH VisiAutrices (Visibilité des femmes de lettres dans l'enseignement du secondaire et du supérieur, 2017-2019, budget accordé : 18 218 €) : [CO 2021]J'ai également participé aux projets de recherche suivants :

Projet Impulsion de l'I-Site FUTURE UrbaNature (Savoirs et cultures de la biodiversité urbaine, XIXe siècle - XXIe siècle, 2020-2023)
Projet Amorçage de Paris-Est Sup Fractext (analyse multifractale pour la classification de données textuelles, 2021-2022)
Projet Amorçage de Paris-Est Sup PROGEVI (production genrée de la ville, 2021-2022)
Projet Exploratoire de l'I-Site FUTURE Cita&Re (Citations & Retractions, 2021) : [JOHD 2024]
ANR APPEL (Analyse Pluridisciplinaire du Pétitionnement En Ligne, 2015-2017) : [JADT'16], [JADT'18], [JOHD 2021], [QC 2019]
SuperBQR Savoirs des femmes (Visibilité et invisibilité des savoirs des femmes - Les créations, les savoirs et leur circulation (XVIe-XXIe), 2017-2018)
SuperBQR Métamorphoses (Entre fiction et notion — Littérature et sciences du XVIe au XXe siècles, 2017-2018)
PEPS CNRS/UPE Eclavit (Extraction CLAssification et VIsualisation de données Textuelles, 2016-2017)
PICS CoCoAlSeq (Combiner des algorithmes combinatoires d'inférence de réseaux et des méthodes d'inférence phylogénétique basées sur les caractères pour reconstruire des réseaux phylogénétiques significatifs, 2015-2017) : [BMB 2016], [PLOS Comp Bio 2017]
PEPS CNRS/UPE Animalhumanité (Expérimentation et fiction : l’animalité au cœur du vivant, 2015-2017) : [CO 2018]
ANR/DFG Biolographes (Création littéraire et savoirs biologiques au XIXe siècle, 2014-2017) : [NPSS 2016], [CO 2021]
PHC Merlion 9.02.13 (Two Algorithmic Issues of Phylogenetic Networks, 2014-2015) : [RECOMB'15], [IWOCA'15], [DAM'17]
PEPS CNRS C1P (Algorithmics of 1D structures, 2012-2013) : [BGW'12]
ANR Moonlight (Predicting MOONLIGHTing proteins from protein-protein interaction networks, 2010-2013) : [MARAMI'11], [RAIRO-OR 2011], [BioSystems 2013]
ANR GRAAL (Décompositions de Graphes et Algorithmes, 2006-2009) : [CPM'09], [IWOCA'09], [JBCB 2012], [JMB 2012]
ANR PHYLARIANE (Phylogénomique : Algorithmes et représentation intégrés pour l'analyse de l'évolution du vivant, 2009-2012) : [CPM'09], [JADT'10], [JBCB 2012], [JMB 2012]Je fais également partie du groupe de travail Graphes du GDR IM.

La conception d'algorithmes pour résoudre des problèmes posés par des biologistes, en particulier dans le domaine de la phylogénie, est au coeur de mes préoccupations. En particulier, j'ai déjà travaillé sur les arbres de duplication (et leur résistance face à certains réarrangements topologiques) avec Denis Bertrand et Olivier Gascuel, et sur la représentation de réseaux phylogénétiques (un certain type de graphes planaires à dessiner automatiquement avec des longueurs d'arêtes imposées) avec Daniel Huson.
Mon doctorat portait d'ailleurs sur les réseaux phylogénétiques, et l'utilisation de méthodes combinatoires. Ces réseaux phylogénétiques correspondent aux arbres d'évolution des espèces, dont certaines branches se rejoignent (créant ainsi un réseau plutôt qu'un arbre) à cause d'échanges de matériel génétique entre deux espèces coexistantes (par transfert horizontal de gène, hybridation, etc.).
Le principe des méthodes combinatoires est de ne pas manipuler directement les séquences d'ADN, mais des ensembles finis de petits éléments (triplets, quadruplets, etc.), ce qui permet d'aborder la reconstruction de réseaux phylogénétiques un peu comme un puzzle. Une bonne approche pour aider à reconstruire ces puzzles est l'utilisation de graphes (ensembles de points ou sommets reliés ou non par des arêtes), que l'on cherche notamment à décomposer, pour résoudre le problème en "divisant pour régner". Ce qui donne une excellente transition pour aborder mon autre domaine de recherche principal.
Parmi les questions combinatoires très théoriques sur les graphes et les arbres, certaines trouvent également des applications sur le langage, en plus de la bioinformatique.
Ainsi, je travaille sur les représentations arborées (inspirées de la phylogénie) qui permettent de représenter les mots d'un texte afin d'obtenir des nuages arborés. L'outil TreeCloud conçu avec Jean Véronis a fait l'objet de multiples utilisations en sciences humaines : analyse de pièces de théâtre avec Delphine Amstutz, d'un corpus de presse sur l'affaire du Médiator avec William Martinez et d'un corpus d'articles du XIXe siècles de la Revue des Deux Mondes sur les savoirs biologiques avec Nadège Lechevrel. J'ai également utilisé cet outil dans des méthodologies d'analyses développées pour un corpus de pétitions en ligne, un corpus de résumés de projets de recherche sur la biodiversité ayant obtenu un financement en Europe ou encore un corpus d'articles scientifiques sur les réseaux phylogénétiques.
Pour l'analyse du langage de patients atteint de la maladie d'Alzheimer, j'ai développé avec avec Hyeran Lee deux logiciels : Densidées, qui permet une évaluation automatique de la densité des idées, indicateur linguistique dont la dégradation a été liée avec l'apparition de la maladie d'Alzheimer, et iPhoComp, qui estime l'indice de complexité phonétique d'une liste de mots en français.
Suite à divers travaux sur des corpus textuels avec des collègues littéraires de l'UPEM, et à la participation au hackathon HackEgalitéFH en mars 2017, à l'issue duquel le projet George, le deuxième texte a été primé, je travaille également sur la constitution et l'analyse d'un corpus de textes littéraires écrits par des femmes et étudiés en collège, lycée et à l'université, dans le cadre du projet PEPS CNRS/RNMSH VisiAutrices que je coordonne (2017-2018).
Je m'intéresse également aux aspects théoriques et algorithmiques de
certaines décompositions de graphes
(décomposition modulaire,
décomposition
arborescente). J'ai aussi travaillé sur diverses classes de graphes d'intersection,
dont celle des graphes
de 2-intervalles et diverses restrictions ou variations.
Je m'interroge sur la complexité (polynomial ou NP-complétude ?) de divers
problèmes de reconnaissance de ces classes de graphes.
Cette recherche a commencé en stage de master, encadré par Michel Habib et en collaboration
avec Stéphane Vialette. Le nuage des mots les plus fréquents dans
mon mémoire donne une bonne idée des thèmes qui m'ont occupé l'esprit :
Avec Christophe Crespelle, nous avons étudié de nouveaux paramètres pour évaluer la complexité des graphes du point de vue de l'encodage des voisinages de leurs sommets : la linéarité et la contiguïté. De bonnes représentations des voisinages nous a déjà conduit à des algorithmes efficaces sur des classes de graphes d'intersection, notamment un algorithme de parcours en largeur des graphes trapézoïdaux selon n'importe quel ordre de priorité fourni en entrée, de complexité linéaire par rapport au nombre de sommets.