Numérisation et Codage Multimédia
Numérisation et Codage Multimédia
Techniques Multimédias
1
08/11/2020
Principe de la numérisation
• Tout signal peut être décomposé en une somme de signaux sinusoïdaux de fréquences
multiples par une transformation de Fourier
• Le spectre des fréquences des composantes sinusoïdales forme la bande passante du
signal
• Un encodeur contient deux circuits :
– Un filtre passe-bas (élimine les hautes fréquences inutiles)
– Un convertisseur analogique numérique (échantillonneur/ quantifieur)
Encodeur
FPB
Signal Echantillonneur Quantificateur Signal
analogique f /bloqueur numérique
2
08/11/2020
Analyse de FOURIER
• Le principe est celui du prisme (un rayon de lumière solaire pénétrant dans un prisme de cristal
en ressort décomposé en plusieurs rayons): le “prisme mathématique de FOURIER” décompose
le signal en une somme de fréquences.
• L’analyse spectrale classique consiste à déterminer mathématiquement de quelles harmoniques
se compose une onde périodique.
L’analyse en fréquences et la transformée de Fourier
Le principe est le suivant : tout signal périodique (ce qui est le cas du son) peut se décomposer en
une série d’oscillations sinusoïdales. Soit () un signal sonore continu dans le temps , la
transformée de FOURIER de ce signal est définie comme suit :
=
Il s’agit d’une fonction dont
la variable est la fréquence
Un signal périodique est représenté par des raies, dont l’emplacement est fixé par la fréquence
des oscillations observées dans le signal (), et l’amplitude est fixé par la valeur des coefficients
définis par FOURIER.
Dans le sens inverse, connaissant le spectre () d’un signal, c’est-à-dire l’énergie de chacune
des fréquences présentes dans le signal, on peut reconstituer sa forme initiale () par la
transformée de FOURIER inverse : =
5
Principe de l’échantillonnage
• Prélever échantillons à intervalles (période d’échantillonnage) d’un signal
analogique () pour générer un signal échantillonné noté ∗ ()
• La fréquence d’échantillonnage est le nombre d’échantillons par unité de temps =
3
08/11/2020
Quantification
• Procédé pour approximer un signal continu
par des valeurs d'un ensemble discret
4
08/11/2020
Codage
• C’est le fait de transformer en binaire la valeur discrète obtenue suite à la quantification
H o r lo g e P é r io d e
d 'é c h a n til lo n n a g e
D u ré e d 'é c h a n t il lo n n a g e
Te
te m p s
E c h a n t il l o n n a g e
Erreur de
quantification E c h a n ti l lo n
5 Q u a n tific a tio n
4
3
2
1
0
Méthodes de numérisation
i. Modulation MIC (PCM: pulse code modulation)
• Consiste à coder sur bits chaque valeur mesurée de la donnée de quantification
• Utilisée dans les formats standards des sons numériques non compressés :
– WAV (Windows)
– AIF (Machintosh)
Exemple
– Déterminer le nombre de bits nécessaires pour numériser la voix humaine avec
Fmax=4000Hz et le codage est sur 8bits.
5
08/11/2020
11
0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 1 0 1 1
12
6
08/11/2020
13
7
08/11/2020
' + Canal de
e'q '*′
_ Q CB DC Q-1
transmission +
'( CB: Codeur binaire '(′ +
Q-1 P
eq DC: Décodeur binaire
s + P: Prédicteur
P Q: Quantificateur
+
Q-1: Quantificateur inverse
On prédit les valeurs futures d’après l’observation des valeurs passées
• On peut réaliser une prédiction en Intra et Inter
– Intra: au sein d’une même séquence,
– Inter: en utilisant la corrélation forte entre les séquences successives.
15
8
08/11/2020
17 Erreur Moyenne=26/14=1.86
2. Composant Audio
• Concept du son :
– Vibrations produites par des cordes vocales, haut-parleur, etc…
– Deux types de signaux : Parole=50Hz à 10kHz et Musique=15Hz à 20kHz,
Basses 15Hz à 300Hz
Médiums 300Hz à 1600Hz
• Caractéristiques Audio : Aigües 1600Hz à 20KHz
– Ton ou hauteur tonale: notion intimement liée à la fréquence,
– Intensité acoustique : Correspond au volume d’énergie d’une onde (amplitude de
la pression d’air par unité de surface, exprimé en W/cm²)
– Timbre :
o Carte d’identité du son, composée par la fréquence fondamentale du son + sons
harmoniques (timbre ou spectre)
o Son sans harmoniques est appelé son pur Fondamentale
Amplitude
Intensité
9
08/11/2020
Compression du son,
• Supprimer les hautes fréquences quasiment inaudibles
• Supprimer les vibrations parasites
• Diminuer la fréquence d’échantillonnage
Diminue fortement le rendu sonore
☺ Solution, VBR (Variable Bit Rate): la fréquence d’échantillonnage s’adapte au son.
Le débit est différent à chaque instant
Autres concepts,
• Le Streaming
– Utilisé principalement par les Web-Radios, WebTV, VoD (Video On Demand),…
– Permet la diffusion et l’écoute d’un flux direct audio ou vidéo (données brutes), stocké
dans la mémoire vive (n'apparaît pas sur le disque dur)
– Fourni par des plateformes: QuickTime, RealPlayer, Windows media Player, Youtube, ...
• Trois grands types d'applications possibles: Streaming stocké (Youtube,…),
Conversations (Skype,...), Streaming live (Sopcast, Twitch...)
20
10
08/11/2020
Autres concepts
• Gestion des droits numériques (DRM: Digital Rights Management)
– Mesure technique basée sur le chiffrement des œuvres numériques
– Limite la lecture et l’enregistrement des fichiers audio/vidéo
– Utilisé sur les boutiques de musique en ligne (iTunes, VirginMusic)
Formats audio
Environ 50 formats audio plus ou moins utilisés.
98% des fichiers audio sont l’un de ces 8 principaux formats:
WAV - MID - MP3 – WMA - AAC - OGG - AIFF - RA
a. Format WAVE (.wav): Format « basique » développé par Microsoft
Sans compression
⊕ Qualité sonore incomparable
⊕ Compatible avec tous les lecteurs audio
ϴ Taille très importante (à ne pas utiliser pour la diffusion par Internet)
21
11
08/11/2020
Famille MPEG
• Idée psychoacoustique: Identifier les échantillons inaudibles afin de les supprimer.
• Idée représentation fréquentielle: Le signal numérique temporel est découpé en
segments de 26 ms (« frames »). On stocke le spectre fréquentiel de chaque frame.
• Le MP3 utilise la technique classique de l’algorithme d’Huffman
o Pas de perte d’information pendant cette étape,
o Permet de compresser jusqu’à 50%,
• Amélioration de la qualité par utilisation d’un VBR,
Taux de compression avec
qualité proche de celle du CD
Layer 1 Destiné à la DCC (Digital 4:1 pour 384 Kbps en stéréo
Compact Cassette)
Layer 2 Compromis entre 6:1 … 8:1 pour 256 … 196 Kbps
complexité et performance en stéréo
Layer 3 Conçu au départ pour un 10:1 … 12:1 pour 128 … 112
23 bitrate très bas (ex : MP3) Kbps en stéréo
12
08/11/2020
3. Composant Image
Il existe une très grande diversité de formats d’images.
Chaque logiciel ne peut traiter qu’un nombre limité de formats.
Classé en deux grandes catégories :
o Images vectorielles ou vectorisées
o Images matricielles ou codées par points (codage Bitmap)
Image
bitmap Pixellisation ou effet
d'escalier
Image
vectorielle
26
13
08/11/2020
14
08/11/2020
Formats de fichiers
Extension Nombre de Compression Commentaires
couleurs
BMP 16 M Non Format standard Windows
JPG 16 M Oui Format courant sur Internet
GIF 256 Oui Permet les animations ainsi que le mode
transparence. Très utilisé sur Internet
ICO 16 ou 256 Non Format des icônes sous Windows
TIFF 16 M Oui Utilisé en gestion de document.
PCX 16 M Non Ancien format (Paintbrush)
PNG 16 M Oui Concurrent libre du Gif
TGA 16 M Oui / Non Haute qualité adapté aux cartes Targa
…
Exemples de formats
i. Format d’échange graphique GIF (Graphic Interchange Format),
Chaque image est précédée
o d’une signature (no de version, etc.),
o une définition d’écran
o et une échelle de couleur.
Compressé avec l’algorithme LZW.
29 Facilité d’emploi + largement diffusé
= + +…+
30
15
08/11/2020
31
16
08/11/2020
33
d) Espace XYZ
• Fondé sur des valeurs virtuelle X = 2,7689 R + 1,7518 G + 1,1301 B
• Idée de base: tous les couleurs peuvent être Y = 1,0000 R + 4,5907 G + 0,0601 B
présentée par des valeurs positives Z = 0,0000 R + 0,0565 G + 5,5943 B
– Y : luminosité
– X et Z : couleur
e) Espaces de couleur CIE (Lab)
• La CIE a proposé en 1976 l’espace Lab de transformation non linéaire des valeurs RVB:
– Aussi connu sous le nom L * a * b * ou CIELab
– L: luminance, L * = [0; 100]; (0 pour le noir à 100 pour le blanc)
– a *: les valeurs négatives indiquent le vert et les valeurs positives le magenta
– b *: les valeurs négatives indiquent le bleu, les valeurs positives le jaune
• CIE est basé sur l’opposition et la trichromatie
– Bleu-Jaune et Rouge-Vert
; 10 ∗ 8= >
% 17.5 ∗ 1.02 ∗ . > / 8= >
A 7 ∗ > . 0.847 ∗ D / 8= >
• Il est implémenté dans Photoshop et dans la plupart des systèmes de gestion des couleurs
34 Deux couleurs proches en distance le sont aussi pour l’œil
17
08/11/2020
3.5 Images en 3D
• Les images en 2D possèdent une représentation simple (bitmap ou
vectoriel),
• Les images en 3D sont plus complexes à manipuler,
– Pas de représentation standard, à cause de la diversité des sources
d’acquisition (scanneur 3D, modélisation 3D, imagerie médicale...).
– Le passage d’une représentation à une autre est complexe,
– Le choix de la forme de représentation doit être judicieux en fonction
du domaine d’application.
• Les formes de représentation des objets 3D sont classés en 2 catégories :
– Représentations volumétriques (voxels),
– Représentations surfaciques (vertexs).
Représentation Représentation
volumétrique Surfacique
35
Représentations volumétriques
Connue sous le nom de reconstruction multi-planaire (MPR: multi-planar reconstruction),
elles génèrent une approximation polyédrique (grille de voxels) d’un objet 3D.
Voxels : Grille uniforme d’échantillons volumétriques. L’acquisition se fait à l’aide de
CT (CAT Scan), MRI, ...
Empilement de Epaisseur de
coupes (images) chaque coupe
18
08/11/2020
Approches surfaciques
Les formes de représentation surfacique peuvent être classés en 2 catégories :
Représentations basées sur des surfaces paramétriques,
Représentations non structurées (nuage de points, maillage triangulaire).
Formats d’images 3D
• Selon le type d'application:
– Format Blender (.blend) pour la création Multimédia
– Format Pro/Engineer (.prt) pour la CAO industrielle
– Format OpenFlight (. FLT)pour la simulation de vol et/ou de conduite.
• Parmi les formats les plus répandus on peut citer :
– 3DS, DXF d'AutoCAD, BLEND de Blender
– IGES normalisé, X Direct 3D, OBJ de Wavefront
– LWO de LightWave 3D
– VRML de réalité virtuelle, avec ses versions (1, 2 et X3D) de Silicon Graphics.
– COB de TrueSpace.
• La tendance actuelle est de privilégier le format descriptif de type X3D (évolution
du VRML avec un formatage XML).
• L’un des critères de choix des modeleurs 3D est de pouvoir lire (Import) et créer
(Export) plusieurs formats.
38 • Le format libre COLLADA permet d'échanger des données entre différents logiciels.
19
08/11/2020
Micro à
reconnaissance Caméra RVB
vocale Moteurs permettant l’orientation
verticale de la tête de Kinect
Enregistrement
40
Restitution
20
08/11/2020
4. Composant Vidéo
• Séquence d'images diffusées à un taux constant (par ex. 24 img/sec).
• Comment encoder une vidéo ?
• Utilisation de la redondance
o Au sein d'une image (dans un ciel, deux pixels différent peu...)
Au lieu d'envoyer n pixels identiques, on envoie 2 valeurs : la
couleur et le nombre de répétitions... Image i
o Entre deux images (peu de différences dans un même plan). Image i+1
• Codage des différences pour limiter le nombre de bits nécessaires.
Encodage vidéo
• Entrelacé (i) :
o Doubler le nombre d'images par seconde perçues avec le même débit.
Une fois les lignes paires, une fois les lignes impaires.
• Progressif (p) :
o Toutes les lignes en même temps.
41 720p vs 1080i par exemple.
Codage Vidéo
•Normes Vidéo de 1èregénération – MPEG- 2/H.262
– JPEG et Motion JPEG • Normes Vidéo de 3ème Génération
– H.261 – MPEG-4 partie 2
– MPEG-1 – MPEG-4 AVC/H.264 partie 10
• Normes Vidéo de 2ème Génération – MPEG-7
– H.263 (H.263+) – MPEG - 21
Applications
• Le Streaming
Trois grands types d'applications possibles:
1. Streaming stocké (audio, vidéo) : Youtube, Netflix, télévision en replay...
o Peut être joué avant d’être entièrement téléchargé.
o Stocké sur un serveur (peut être envoyé plus rapidement que reçu : nécessite un
buffer côté client) (ou P2P (Spotify)),
2. Conversations (audio/vidéo sur IP): Skype, Google...
3. Streaming live audio/vidéo : Sopcast, Twitch...
42
21
08/11/2020
Formats de conteneurs
• ASF : le plus prometteur, format récent développé par Microsoft
– Supporte tous les formats audio et vidéo
– AVI amélioré : plusieurs pistes audio, vidéo et texte
– Très utilisé pour le streaming par internet
– Compatible avec les DRM (gestion des droits numérique)
– Format utilisé sur les successeurs du DVD : Blu-Ray et HD-DVD
• RealMedia: en perte de vitesse, développé par RealNetworks
– Supporte de nombreux formats (spécialement les formats Real Audio et Real Movie)
– Adapté au streaming
– Supporte uniquement le CBR (Constant Bit Rate) Mauvaise compression des données
– De plus en plus délaissé au profit des formats ASF et Quicktime
– Lecture uniquement avec RealPlayer, souvent jugé trop intrusif.
• MP4: Quicktime amélioré, utilisé pour les DivX. Très souple, peut contenir des images.
• 3GP: Dérivé du MP4 pour les téléphones mobiles.
44
22
08/11/2020
46
23
08/11/2020
24