Hidden Markov Model - Description du modèle

Modèle de Markov

Avant de passer à la description d'un modèle de Markov caché, voyons d'abord ce qu'est un modèle de Markov.

Le modèle de Markov, aussi appelé Chaîne de Markov, est un modèle statistique composé d'états et de transitions. Une transition matérialise la possibilité de passer d'un état à un autre.
Dans le modèle de Markov, les transitions sont unidirectionnelles : une transition de l'état A vers état B ne permet pas d'aller de l'état B vers l'état A. Tous les états ont des transitions vers tous les autres états, y compris vers eux-mêmes. Chaque transition est associée à sa probabilité d'être empruntée et cette probabilité peut éventuellement être nulle.

Voici la représentation d'un modèle de Markov simple avec 2 états :

Représentation d'un modèle de Markov

On note la présence d'un état "Début" qui sert à présenter les probabilités de commencer dans chacun des états du modèle : ici on a 40% de chances (0.4) de commencer dans l'état 1 et 60% de chances (0.6) de commencer dans l'état 2. Par définition, on ne revient jamais à l'état de départ, raison pour laquelle il n'y a jamais de transition vers cet état.
On remarque également que la somme des probabilités des transitions partant d'un état est toujours égale à 1 (100%).
    Par exemple, pour l'état 1 : 0.7 + 0.3 = 1
Cette propriété doit toujours être vraie ! En effet si la somme n'était pas égale à 1, cela signifierait qu'il existe une chances de ne pas opérer de transition, ce qui est impossible dans un modèle de Markov.

L'utilisation du modèle se fait en rapport avec le temps. A chaque "unité de temps", on opère une transition, ce qui génère finalement une séquence d'états :

Evolution d'un modèle de Markov

Sur cet extrait de séquence, on voit qu'au moment t-1 on était sur l'état 1, puis au moment t sur l'état 2, puis au moment t+1 sur l'état 2. Comme il existe des transitions d'un état vers lui même, il est possible que le même état soit plusieurs fois d'affilée dans la séquence, ce qui est le cas dans notre exemple.

Dans le contexte d'un modèle de Markov, on étudierait la séquence d'états produite par le modèle, principalement sa probabilité d'apparition.
Passons maintenant au modèle de Markov caché

Modèle de Markov Caché

Un modèle de Markov caché est basé sur un modèle de Markov, sauf qu'on ne peut pas observer directement la séquence d'états : les états sont cachés. Chaque état émet des "observations" qui, elles, sont observables. On ne travaille donc pas sur la séquence d'états, mais sur la séquence d'observations générées par les états.

Pour comprendre, reprenons le modèle de Markov représenté plus haut et transformons le en modèle de Markov caché :

Représentation d'un modèle de Markov caché

On retrouve bien le modèle de Markov : l'état "Début", les deux états "Etat 1" et "Etat 2" et les transitions avec leur probabilité associée.
On y a ajouté deux observations : "A" et "B". Chaque état peut émettre chacune des observations avec une certaine probabilité que nous appelons "probabilité d'émission". Cette probabilité peut éventuellement être nulle, ce qui signifie que l'état ne peut pas émettre l'observation concernée.
Dans notre exemple, l'état 1 a 50% de chances (0.5) d'émettre un "A" et 50% de chances d'émettre un "B", tandis que l'état 2 a 90% de chances (0.9) d'émettre un "A" et 10% (0.1) d'émettre un "B".
Comme pour les transitions partant d'un état, la somme des probabilités d'émission d'un état doit toujours être égale à 1.

Comme le modèle de Markov, le modèle de Markov caché évolue dans le temps. Mais cette fois, on ne peut pas observer la séquence d'états, on ne voit que la séquence d'observations. Notez cependant que cette séquence d'états existe, elle est simplement cachée.
A chaque unité de temps, on opère une transition qui nous amène dans un état. Cet état émet alors une observation selon les probabilités d'émission. L'évolution dans le temps génère donc une séquence d'observations :

Evolution d'un modèle de Markov caché

Ici la séquence d'états a généré la séquence d'observations "A","A","B". La séquence d'états est représentée pour aider à la compréhension, mais on ne la connait pas lors de l'utilisation du modèle.

Mathématiquement, pour finir, un HMM se décrit par 5 paramètres :
    - N : le nombre d'états ;
    - M : le nombre d'observations ;
    - S : la matrice des probabilités de départ [1xN], c'est à dire les probabilités de démarrer dans chacun des N états ;
    - A : la matrice des probabilités de transition [NxN], c'est à dire les probabilités de passer d'un état à l'autre ;
    - B : la matrice des probabilités d'émission [NxM], c'est à dire les probabilités pour chaque état d'émettre chacune des observations possibles ;

Aller aux Trois questions