Introduction à la biologie moléculaire (Marie-Odile Delorme et Alain Hénaut)

Next: Méthodes probabilistes pour le Up: Traitement des génomes Previous: Traitement algorithmique des séquences

Introduction à la biologie moléculaire (Marie-Odile Delorme et Alain Hénaut)

La première partie de ce cours est consacrée à l'enseignement des bases de la biologie moléculaire en quatre chapitres : l'ADN et la réplication, les ARNs et la transcription, les protéines et la traduction, le contrôle de l'expression des gènes.

La seconde partie du cours est consacrée à l'étude des méthodes classiques utilisées. Au-delà de la connaissance des outils existants, l'approche informatique pose des problèmes théoriques difficiles, souvent non résolus. Certains relèvent de la recherche en informatique, les autres ont une origine purement biologique, ils correspondent le plus souvent à la difficulté de définir clairement les objets que manipulent les biologistes.

Quatre thèmes sont retenus :

L'utilisation de codons synonymes. La moitié des gènes découverts lors du séquençage systématique codent pour des protéines qui ne ressemblent à rien de connu. L'analyse de l'utilisation des codons synonymes devrait permettre d'accélérer l'identification de leur fonction.
La signification des similitudes dans les séquences des protéines. Cette question n'a pas reçu de réponse définitive car elle est mal définie d'un point de vue biologique. L'étude comparée des méthodes utilisées actuellement permet au moins de bien cerner le problème, faute de la résoudre.
L'identification des signaux dans les séquences nucléiques. Les rares programmes efficaces sur le sujet combinent des informations qui ne sont pas toutes du même ordre (séquence primaire, structures secondaires) et ils font jouer un rôle fondamental à l'organisation spatiale.
La mesure de l'information contenue dans une séquence. Les travaux sur la plasticité des génomes ont attiré l'attention sur des morceaux du génome qui ont une structure particulière, le dosDNA. Le dosDNA correspond à l'ensemble des séquences qui contiennent des bases organisées selon des éléments de symétries spécifiques. Il semble difficile d'écrire un programme qui détecterait toutes les zones de dosDNA, tant elles sont diverses. Une approche très prometteuse est basée sur la mesure de la complexité algorithmique d'une séquence.

Next: Méthodes probabilistes pour le Up: Traitement des génomes Previous: Traitement algorithmique des séquences

Dominique Perrin
Thu May 2 14:25:15 METDST 1996