Next: Méthodes probabilistes pour le
Up: Traitement des génomes
Previous: Traitement algorithmique des séquences
La première partie de ce cours est consacrée à l'enseignement
des bases de la biologie moléculaire en quatre chapitres : l'ADN
et la réplication, les ARNs et la transcription, les protéines
et la traduction, le contrôle de l'expression des gènes.
La seconde partie du cours est consacrée à l'étude des méthodes
classiques utilisées.
Au-delà de la connaissance des outils existants, l'approche informatique
pose des problèmes théoriques difficiles, souvent non résolus.
Certains relèvent de la recherche en informatique, les autres ont une
origine purement biologique, ils correspondent le plus souvent à
la difficulté de définir clairement les objets que manipulent les
biologistes.
Quatre thèmes sont retenus :
- L'utilisation de codons synonymes.
La moitié des gènes découverts lors du séquençage systématique
codent pour des protéines qui ne ressemblent à rien de connu.
L'analyse de l'utilisation des codons synonymes devrait permettre
d'accélérer l'identification de leur fonction.
- La signification des similitudes dans les séquences des protéines.
Cette question n'a pas reçu de réponse définitive car elle est mal
définie d'un point de vue biologique.
L'étude comparée des méthodes utilisées actuellement permet
au moins de bien cerner le problème, faute de la résoudre.
- L'identification des signaux dans les séquences nucléiques.
Les rares programmes efficaces sur le sujet combinent des informations
qui ne sont pas toutes du même ordre (séquence primaire,
structures secondaires) et ils font jouer un rôle fondamental à
l'organisation spatiale.
- La mesure de l'information contenue dans une séquence.
Les travaux sur la plasticité des génomes ont attiré l'attention
sur des morceaux du génome qui ont une structure particulière,
le dosDNA.
Le dosDNA correspond à l'ensemble des séquences qui contiennent
des bases organisées selon des éléments de symétries spécifiques.
Il semble difficile d'écrire un programme qui détecterait toutes
les zones de dosDNA, tant elles sont diverses.
Une approche très prometteuse est basée sur la mesure de la complexité
algorithmique d'une séquence.
Next: Méthodes probabilistes pour le
Up: Traitement des génomes
Previous: Traitement algorithmique des séquences
Dominique Perrin
Thu May 2 14:25:15 METDST 1996