|
Compression de Video |
Dans cette partie, nous allons aborder le codage du dernier élément multimédia qui a été développé : la video. |
Codage M-JPEG |
M.J.P.E.G. ou Motion Joint Photographic Expert Group Le MJPEG est le nom d'une norme JPEG (Joint Photographic Experts Group) adaptée aux images vidéo entrelacées. L'algorithme MJPEG traite chaque image indépendamment des autres. L'image est compressée selon une taille prédéfinie par l'utilisateur. Le traitement des données se fait également sur la chrominance et luminance de l'image. Ce type de codage est le moins utilisé des 2 car il dispose de taux de compression ridicule en comparaison du MPEG |
retour index | |
Codage MPEG |
M.P.E.G. ou Moving Picture Expert Group La Digital Video développée par Philips et commercialisée en France depuis le début de l'année 94 est le premier produit fondé sur la norme MPEG 1. Le nom de cette norme, adoptée depuis maintenant près de deux ans, est directement issu de celui du groupe d'experts qui a eu en charge de l'élaborer -- Moving Pictures Experts Group -- sous l'égide de l'ISO (International Standard Organisation). Outre ceux de Philips, de nombreux représentants de grandes industries internationales de l'informatique, des télécommunications, de la télédiffusion et de l'électronique ont mis en commun leurs savoir-faire en prenant part à ces travaux. L'objectif de cette norme était de permettre de restituer, à partir d'un disque compact à lecture optique, plus communément appelé Compact Disc ou CD, 72 minutes de vidéo numérique plein écran, animées au rythme de 25 images ou 30 images par seconde et associées aux sons qui les accompagnent. Le pari était audacieux mais il fut gagné en l'espace de seulement trois ans. Cette norme MPEG 1, qui concerne aussi bien la vidéo que l'audio, a été adoptée à la fin de l'année 1992 sous la référence ISO 11172. C'est une norme de restitution et non de production, destinée uniquement à la diffusion éditoriale. D'autres travaux sont menés par ce même groupe d'experts pour définir une autre norme appelée MPEG 2 qui est, quant à elle, destinée à la diffusion de la future télévision numérique. |
Principe Général |
La norme MPEG repose sur 3 parties discintes pour réussir à restituer correctement les images et le son. Ces 3 parties sont : ![]() |
MPEG Video |
Pour tirer parti de ces redondances, les images ne sont pas traitées et compressées de la même façon. C'est ainsi qu'une séquence vidéo à la norme
MPEG 1 est composée de trois types d'images :
Les images Intra sont codées intégralement, sans aucune référence aux images voisines de la séquence vidéo. C'est la redondance spatiale qui est exploitée et éliminée à l'aide d'une opération mathématique relativement complexe appelée Transformation en Cosinus Discret ou DCT (Discret Cosinus Transform). Cette opération est réalisée après analyse de l'image en trois plans (Y, Cr, Cb). Chacun de ces plans est décomposé en blocs de 8 x 8 pixels et transformé en matrices de coefficients fréquentiels classés selon l'amplitude des signaux. Ces coefficients sont ensuite quantifiés. La profondeur de quantification est variable en fonction du contenu de chaque bloc : les détails fins, moins perceptibles à l'oeil, seront sous-quantifiés au profit des détails plus grossiers, afin d'éviter l'apparition d'effets de "pixélisation" de certaines zones de l'image. De même, les points isolés sont codés de façon grossière car l'oeil se satisfait de les voir et cela quelle que soit leur intensité. Ces mots de code binaires sont alors soumis au codage statistique dit à longueur variable ou VLC (Variable Level Coding) qui consiste à coder les informations les plus fréquentes à l'aide de mots courts et les informations les plus rares à l'aide de mots longs. Les images Intra constituent les images de référence à partir desquelles est réalisé le décodage. C'est pourquoi chaque changement de plan dans une séquence vidéo commence obligatoirement par une image de type I. À l'intérieur de celle-ci, la norme MPEG 1 indique qu'une image sur douze doit être une image Intra. Les images Prédictives Les images Prédictives exploitent à la fois la redondance spatiale et la redondance temporelle des images d'une séquence vidéo. Elles sont codées à partir de l'image I ou P précédente à l'aide de vecteurs de mouvement. Les images sont découpées en blocs de 16 x 16 pixels. Les vecteurs de mouvement sont ensuite calculés en fonction du déplacement de chacun de ces blocs de pixels d'une image à la suivante puis codés en DPCM (Differential Pulse Code Modulation), c'est-à-dire que seule la différence entre les vecteurs de l'image n et les vecteurs de l'image n + 1 est prise en compte. Ces valeurs sont ensuite soumises au codage à longueur variable (VLC). La norme MPEG 1 fixe à deux le nombre d'images séparant deux images prédites ou une image prédite et une image Intra. Elle prévoit aussi trois images prédites en deux images Intra. Les images Bidirectionnelles Les images Bidirectionnelles sont les plus compressées. Elles sont codées à l'aide de vecteurs de mouvement avant et arrière, par prédiction bidirectionnelle, c'est-à-dire à partir des images voisines passées et futures. Au décodage, elles sont entièrement reconstruites par interpolation, c'est-à-dire que chaque bloc de pixels constituant ce type d'images prend la valeur moyenne du bloc de pixels correspondant de l'image I ou P précédente et à venir dans la séquence d'affichage, à la sortie du décodeur (fig. 1). ![]() |
MPEG Audio |
Le codage utilisé dans le MPEG Audio est le même que celui du MP3.
|
MPEG System |
Pour pouvoir synchroniser correctement le son et l'image, MPEG dispose d'une partie à part chargée d'assembler les 2 flux. Cette partie se compose
de 2 parties :
Le SCR Le SCR est une horloge de référence du système. Ce SCR est codé sur les 2 flux et sert à les synchroniser. Par exemple, si on décide de commencer à voir un film à partir de la 45ème minute, il suffit de synchroniser le son et l'image sur la 45ème minute. Le PTS Le PTS est un marqueur temporel. Au contraire du SCR, celui-ci n'est codé que sur le flux vidéo et sert à indiquer le top de départ à une image. Cela évite qu'une image ne commence trop tot ou ne parte trop tard. |
retour index |