0% ont trouvé ce document utile (0 vote)
186 vues24 pages

Numérisation et Codage Multimédia

Ce document décrit les principes de base de la numérisation des données multimédias, y compris la numérisation, l'échantillonnage, la quantification et le codage des signaux analogiques en signaux numériques. Il explique également les composants clés du traitement numérique des médias tels que l'audio, les images et la vidéo.
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
186 vues24 pages

Numérisation et Codage Multimédia

Ce document décrit les principes de base de la numérisation des données multimédias, y compris la numérisation, l'échantillonnage, la quantification et le codage des signaux analogiques en signaux numériques. Il explique également les composants clés du traitement numérique des médias tels que l'audio, les images et la vidéo.
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

08/11/2020

Faculté des Sciences de Monastir A.U. 2020/21

Techniques Multimédias

II. Composants multimédia


1. Numérisation des données
2. Composant Audio
3. Composant Image
4. Composant vidéo
5. Autres types de médias

Proposé par Mr Samir Belaid


1

1. Numérisation des données


• l’interactivité multimédia se traduit par un échange de signaux numériques entre
les différentes composantes des équipements
Représentation binaire des données
Rappel
Numérisation Codage

Données continues ou analogiques Données discrètes


-Modulation MIC ou PCM
-Modulation DELTA
Données non numériques
Codage par tables Codage par compression
Données numériques (longueur fixe) (longueur variable)
BAUDOT, ASCII, Huffman
EBCDIC, UNICODE

Nombres Nombres Nombres


non signés signés fractionnaires
Conversion directe Signé + valeur Absolue Virgule fixe
décimal==>binaire Complément à 1 Virgule Flottante (mantisse, base
Complément à 2 exposant)
2

1
08/11/2020

Signal analogique vs Signal numérique


i. Signal analogique,
• Contenu dans le temps,
• Représenté par un courant ou une tension, Signal analogique

• Amplitude prend une infinité de valeurs dans un intervalle fini,


ii. Signal numérique,
• Signal discret dans le temps,
• L’amplitude représente deux états logiques 1 ou 0,
Signal numérique
• Chaque état logique est représentée par une tension (+5V, 0V).
iii. Atouts de la numérisation,
• Signal numérique plus stable et plus résistant aux parasites,
• Opération de transfert plus aisée grâce à la compression,
• Opérations mathématiques plus faciles et moins couteuses.
3

Principe de la numérisation
• Tout signal peut être décomposé en une somme de signaux sinusoïdaux de fréquences
multiples par une transformation de Fourier
• Le spectre des fréquences des composantes sinusoïdales forme la bande passante du
signal
• Un encodeur contient deux circuits :
– Un filtre passe-bas (élimine les hautes fréquences inutiles)
– Un convertisseur analogique numérique (échantillonneur/ quantifieur)

Encodeur
FPB
Signal Echantillonneur Quantificateur Signal
analogique f /bloqueur numérique

2
08/11/2020

Analyse de FOURIER
• Le principe est celui du prisme (un rayon de lumière solaire pénétrant dans un prisme de cristal
en ressort décomposé en plusieurs rayons): le “prisme mathématique de FOURIER” décompose
le signal en une somme de fréquences.
• L’analyse spectrale classique consiste à déterminer mathématiquement de quelles harmoniques
se compose une onde périodique.
L’analyse en fréquences et la transformée de Fourier
Le principe est le suivant : tout signal périodique (ce qui est le cas du son) peut se décomposer en
une série d’oscillations sinusoïdales. Soit () un signal sonore continu dans le temps , la
transformée de FOURIER de ce signal est définie comme suit :

  =  
 
Il s’agit d’une fonction dont
la variable est la fréquence 


Un signal périodique est représenté par des raies, dont l’emplacement est fixé par la fréquence
des oscillations observées dans le signal (), et l’amplitude est fixé par la valeur des coefficients
définis par FOURIER.
Dans le sens inverse, connaissant le spectre () d’un signal, c’est-à-dire l’énergie de chacune
des fréquences présentes dans le signal, on peut reconstituer sa forme initiale () par la

transformée de FOURIER inverse :   =    
5


Principe de l’échantillonnage
• Prélever  échantillons à intervalles  (période d’échantillonnage) d’un signal
analogique () pour générer un signal échantillonné noté  ∗ ()

• La fréquence d’échantillonnage est le nombre d’échantillons par unité de temps  =


Signal analogique Signal échantillonné


Impulsions de Dirac

3
08/11/2020

Choix de la fréquence d’échantillonnage


• Plus la fréquence d'échantillonnage est grande, plus la perte d'information pendant
l'échantillonnage est faible (la forme de  ∗ () est proche de ()).
théorème de Nyquist-Shannon:    !
( ! fréquence maximale du signal)

Une infinité de signaux analogiques


peuvent coïncider sur les mêmes
échantillons

Fe=1/Te Qualité du son


44 100 Hz Qualité CD
22000 Hz Qualité radio
8000 Hz Qualité téléphone
7

Quantification
• Procédé pour approximer un signal continu
par des valeurs d'un ensemble discret

Le pas de quantification Vmin Vmax


dépend du nombre de bits n
considérés pour le codage
q =
(Vmax − Vmin )
2n
Quantification scalaire uniforme
• Le découpage se fait en intervalle de quantification constante (le type le plus simple)
• Plus n est élevé, plus la valeur discrète est proche de la valeur instantanée du signal
original.
Quantification vectorielle
• Regrouper les échantillons pour construire un « dictionnaire ».
8

4
08/11/2020

Codage
• C’est le fait de transformer en binaire la valeur discrète obtenue suite à la quantification
H o r lo g e P é r io d e
d 'é c h a n til lo n n a g e
D u ré e d 'é c h a n t il lo n n a g e
Te

te m p s
E c h a n t il l o n n a g e
Erreur de
quantification E c h a n ti l lo n

5 Q u a n tific a tio n
4
3
2
1
0

C o d a g e 0 00 0 001 1 00001011 0 00 0 100 1 0000 0 10 1 00000010

Codes à longueur fixe/variable


• Généralement, on utilise un nombre de bits  fixe pour représenter tous les éléments du
code. D’autres techniques, assimilable à la compression de données, emploient des codes
de longueur  variable.
9

Méthodes de numérisation
i. Modulation MIC (PCM: pulse code modulation)
• Consiste à coder sur  bits chaque valeur mesurée de la donnée de quantification
• Utilisée dans les formats standards des sons numériques non compressés :
– WAV (Windows)
– AIF (Machintosh)
Exemple
– Déterminer le nombre de bits nécessaires pour numériser la voix humaine avec
Fmax=4000Hz et le codage est sur 8bits.

Solution : * Si on prend 4000Hz comme fréquence maximale à reproduire, la


fréquence d’échantillonnage minimale est de : Fe ≥ 2.Fmax
=2×4000=8000 Hz (8000éch/s) et Te=125µs(1/8000)
* En codant chaque échantillon sur 8 bits il est nécessaire d’écouler :
8000×8 = 64000 bits sur le lien. Ce qui correspond à un débit de 64kb/s
10

5
08/11/2020

ii. Modulation MIC Delta ∆


• Modulation numérique différentielle caractérisée par une quantification à un seul bit,
• Ses paramètres sont : la fréquence d'échantillonnage, le pas de quantification, le débit D=fe

11

ii. Modulation MIC ∆ : Exemple


Soit les données analogiques suivantes à coder sur 4 bits (lignes verticales-instants
d'échantillonnage).
1)Quelle est la séquence binaire en utilisant le codage Delta.
2)Déduire le taux de compression obtenu par rapport au codage MIC.

0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 1 0 1 1

12

6
08/11/2020

ii. Modulation MIC ∆ : Limites

Saturation de pente Lorsque u(t) est constante


et le signal estimé oscille
autour de u(t)

Saturation de pente Bruit de granularité


Solution: Respecter la condition :
∆ &()
# $%
 

13

iii. Modulation PCM différentielle (DPCM)

• Quantifier les échantillons avant


d’être convertis en une suite de
valeurs binaires 0 ou 1: codage
PCM (Pulse Code Modulation),
• Coder la différence d’une valeur
par rapport à la précédente: Codage
DPCM (Differential Pulse Code
Modulation)

m(t) 1.3 2.8 1.8 0.6 -0.5 -2.3


• . m[nTs] 1.5 2.5 1.5 0.5 -0.5 -2.5
Numéro d’ordre 5 6 5 4 3 1
Code PCM 101 110 101 100 011 001
Code DPCM 101 +1 -1 -1 -1 -2
14

7
08/11/2020

iv. Codage prédictive


Principe Prédire une valeur ensuite quantifier uniquement la différence (de manière
non uniforme) entre la valeur prédite (état futur) et la valeur réelle.

' +  Canal de
e'q '*′
_ Q CB DC Q-1
transmission +
'( CB: Codeur binaire '(′ +
Q-1 P
eq DC: Décodeur binaire
s + P: Prédicteur
P Q: Quantificateur
+
Q-1: Quantificateur inverse
On prédit les valeurs futures d’après l’observation des valeurs passées
• On peut réaliser une prédiction en Intra et Inter
– Intra: au sein d’une même séquence,
– Inter: en utilisant la corrélation forte entre les séquences successives.
15

iv. Codage prédictive


Algorithme:
1. Calculer la différence entre le signal d’entrée ' et une valeur de prédiction '(,
2. '( est une combinaison linéaire de ' et de ses prédécesseurs,
3. Différentes combinaisons existent pour déterminer la valeur de prédiction '(,
4. Si '- est l’échantillon considéré alors '( peut être défini par '- − /, '- − , ('- − / + '- −  + '- − 1)/1,
'- − / + ('- −  − '- − 1)/, ('- − / + '- − )/ (La valeur de prédiction est connue du décodeur),
5. L’erreur « ' − '( » est ensuite quantifiée à l’aide d’un vecteur de quantification et on obtient 4
(Ces valeurs sont codées en mots binaires par indexation),
6. On reconstruit simplement la valeur codée en ajoutant eq à la valeur de prédiction.
Erreur de prédiction Valeur quantifiée de e : eq Erreur de prédiction Valeur quantifiée de e : eq
- 255 ≤ e ≤ -70 - 80 9 ≤ e ≤ 18 12
Exemple de table - 69 ≤ e ≤ - 50 - 58 19 ≤ e ≤ 32 25
de quantification - 49 ≤ e ≤ -33 - 40 33 ≤ e ≤ 47 39
-32 ≤ e ≤ - 19 - 25 48 ≤ e ≤ 64 55
-18 ≤ e ≤ - 9 - 12 65 ≤ e ≤ 83 73
-8 ≤ e ≤ - 3 -4 84 ≤ e ≤ 104 93
-2 ≤ e ≤ 2 0 105 ≤ e ≤ 127 115
16 3≤e≤8 4 128 ≤ e ≤ 255 140

8
08/11/2020

iv. Codage prédictive


La forme la plus simple du codage prédictif est la Modulation Delta ou « linéaire Modulation ». Le
prédicteur est une fonction, dépendant simplement de la valeur de la donnée précédente, et on utilise un
quantificateur sur 1 bit ce qui permet une représentation sur 1 bit du signal.
Exercice
Si l’on considère que la valeur de prédiction pour l’indice i est obtenue par ̂ = (6 − 1 + 6 − 2)/2 pour
i>2. Si i =2 (2éme échantillon) ̂ = 1 et 1 est transmis tel quel. On utilise la table de quantification
précédente, la transmission des indexes est codée sur 4 bits.
Vecteur original 100 102 106 92 98 100 104 100 70 80 92 98 72 76
1) Calculer'( le vecteur
100 de prédiction
101 104 99avec 95
les règles
99 énoncées
102 102plus 85
haut. 75 86 95 85
2) Calculer le vecteur
2 d’erreurs
5 -12 de -1prédiction.
5 5 -2 -32 -5 17 12 -23 -9
3) Quantifier 0 4 -12 0 4 4 0 -25 -4 12
8 le vecteur d’erreurs de prédiction à l’aide de la table précédente. 12 -25 -12
4) Reconstruire 100 104
le signal (en 90 97
arrondissant 98 102
à l’entier 100 89
supérieur). 99
Quelle 98
est 103
l’erreur 89 96
moyenne ?
'( 100 101 104 99 95 99 102 102 85 75 86 95 85

'(:- /'(:-  2 5 -12 -1 5 5 -2 -32 -5 17 12 -23 -9


'9-: =

+ 4 8 0 4 -12 0 4 4 0 -25 -4 12 12 -25 -12

100 100 104 90 97 98 102 100 76 84 92 100 71 74

17 Erreur Moyenne=26/14=1.86

2. Composant Audio
• Concept du son :
– Vibrations produites par des cordes vocales, haut-parleur, etc…
– Deux types de signaux : Parole=50Hz à 10kHz et Musique=15Hz à 20kHz,
Basses 15Hz à 300Hz
Médiums 300Hz à 1600Hz
• Caractéristiques Audio : Aigües 1600Hz à 20KHz
– Ton ou hauteur tonale: notion intimement liée à la fréquence,
– Intensité acoustique : Correspond au volume d’énergie d’une onde (amplitude de
la pression d’air par unité de surface, exprimé en W/cm²)
– Timbre :
o Carte d’identité du son, composée par la fréquence fondamentale du son + sons
harmoniques (timbre ou spectre)
o Son sans harmoniques est appelé son pur Fondamentale
Amplitude
Intensité

Note mi4 jouée


par un violon
18 0
0 2 4 6 t(ms) 0 1 2 3 4 f(kHz)

9
08/11/2020

Mesure de qualité du son


• Intensité audible : 0∼∼120dB
• Résolution sonore (Bits de quantification):
Parole=12 bits, Musique=16 bits,
• Stéréophonie : Mono, full stéréo, joint stéréo…
• Débit binaire (Bit rate): D(b/s)= fe×nbCan×nbBitsQtf
(Plus il est élevé, plus la qualité est bonne)
Qualité du son Bit rate (CBR)
Qualité CD 1440 Kbit/s Joint Stéréo : On enregistre la partie
Fichier MP3 compressé au minimum 320 Kbit/s grave du spectre en monophonique.
Qualité correcte au format MP3 128 ou 192 Kbit/s On fait 50% relativement à un
Fichier MP3 compressé au maximum 64 Kbit/s enregistrement stéréomonophique
Son de qualité téléphonique 32 Kbit/s
o Codage 1 min CD Audio = 8,5Mo
o Codage 1 min son MP3 (avec compression 128 Kb/s) = 960 Ko
19 o Codage 1min son qualité téléphonique =240 Ko

Compression du son,
• Supprimer les hautes fréquences quasiment inaudibles
• Supprimer les vibrations parasites
• Diminuer la fréquence d’échantillonnage
 Diminue fortement le rendu sonore
☺ Solution, VBR (Variable Bit Rate): la fréquence d’échantillonnage s’adapte au son.
Le débit est différent à chaque instant
Autres concepts,
• Le Streaming
– Utilisé principalement par les Web-Radios, WebTV, VoD (Video On Demand),…
– Permet la diffusion et l’écoute d’un flux direct audio ou vidéo (données brutes), stocké
dans la mémoire vive (n'apparaît pas sur le disque dur)
– Fourni par des plateformes: QuickTime, RealPlayer, Windows media Player, Youtube, ...
• Trois grands types d'applications possibles: Streaming stocké (Youtube,…),
Conversations (Skype,...), Streaming live (Sopcast, Twitch...)
20

10
08/11/2020

Autres concepts
• Gestion des droits numériques (DRM: Digital Rights Management)
– Mesure technique basée sur le chiffrement des œuvres numériques
– Limite la lecture et l’enregistrement des fichiers audio/vidéo
– Utilisé sur les boutiques de musique en ligne (iTunes, VirginMusic)
Formats audio
 Environ 50 formats audio plus ou moins utilisés.
 98% des fichiers audio sont l’un de ces 8 principaux formats:
WAV - MID - MP3 – WMA - AAC - OGG - AIFF - RA
a. Format WAVE (.wav): Format « basique » développé par Microsoft
 Sans compression
⊕ Qualité sonore incomparable
⊕ Compatible avec tous les lecteurs audio
ϴ Taille très importante (à ne pas utiliser pour la diffusion par Internet)
21

b. Format MIDI (.mid): (Musical Instrument Digital Interface)


 Pas de « son », mais une succession de notes (note jouée, vélocité, durée, etc…)
⊕ Taille extrêmement réduite
ϴ Impossibilité de retranscrire la voix dans ce format
c. Format MP3 (.mp3): Le format le plus répandu actuellement.
• Moving Picture Expert Group : définit les standards de compression pour la vidéo et
l’audio (Norme : ISO/IEC JTC1 SC29 WG11),
• Spécifications de 3 couches, appelés layers : du niveau 1 au niveau 3 (Note : MP3 =
MPEG-1 layer 3).
• Point commun : Utilisation conjointe d’un modèle psychoacoustique et d’une
représentation fréquentielle du signal.
 Son compressé avec pertes
⊕ Compatible avec presque tous les logiciels
⊕ Idéal pour la diffusion libre par Internet
ϴ Pas de gestion des droits d’accès (DRM) et Pas de streaming
22

11
08/11/2020

Famille MPEG
• Idée psychoacoustique: Identifier les échantillons inaudibles afin de les supprimer.
• Idée représentation fréquentielle: Le signal numérique temporel est découpé en
segments de 26 ms (« frames »). On stocke le spectre fréquentiel de chaque frame.
• Le MP3 utilise la technique classique de l’algorithme d’Huffman
o Pas de perte d’information pendant cette étape,
o Permet de compresser jusqu’à 50%,
• Amélioration de la qualité par utilisation d’un VBR,
Taux de compression avec
qualité proche de celle du CD
Layer 1 Destiné à la DCC (Digital 4:1 pour 384 Kbps en stéréo
Compact Cassette)
Layer 2 Compromis entre 6:1 … 8:1 pour 256 … 196 Kbps
complexité et performance en stéréo
Layer 3 Conçu au départ pour un 10:1 … 12:1 pour 128 … 112
23 bitrate très bas (ex : MP3) Kbps en stéréo

d. Format Windows Media Audio (.wma): Crée par Microsoft


 Alternative au MP3, plus souple mais moins répandu.
⊕ Compressé, non compressé, avec ou sans DRM, streaming
⊕ Adapté à la diffusion par Internet
ϴ Uniquement Compatible avec les logiciels Microsoft.
e. Format Advanced Audio Coding (.aac): Concurrent du WMA crée par Apple
 Spéciale iPod et iTunes
⊕ Son compressé mais de très bonne qualité
⊕ Possibilité de DRM : technique Fairplay
ϴ Peu compatible
f. Format OGG Vorbis (.ogg) : Amélioration du MP3
 librement exploitable et entièrement gratuit.
⊕ Bonne compression, très bonne qualité sonore
24 ϴ Peu compatible

12
08/11/2020

g. Format Real Audio (.ra): Introduit par RealMedia.


 Uniquement destiné à la diffusion par Internet
⊕ Bonne possibilité de compression
ϴ Peu manipulable, peu compatible avec d’autres logiciels (à part RealPlayer)
h. Format CD Audio (.cda):
 Uniquement utilisé sur les CD Audio pour représenter les pistes du CD.
 Les pistes sont en fait au format WAV.
⊕ Meilleure qualité possible, aucune compression
Ө Exploitable en lecture seulement
ϴ Ce n’est pas un fichier. Un logiciel pour extraire le fichier WAV.
Nom Taille de Qualité Compatibilité Diffusion sur Possibilité de Possibilité
fichier sonore Internet streaming de DRM
WAV     Non Non
En résumé… MID     Non Non
MP3     Non Non
WMA     Oui Oui
AAC     Non Oui
OGG     Oui Non
RA     Oui Non
25 CDA    0 Non Non

3. Composant Image
 Il existe une très grande diversité de formats d’images.
 Chaque logiciel ne peut traiter qu’un nombre limité de formats.
 Classé en deux grandes catégories :
o Images vectorielles ou vectorisées
o Images matricielles ou codées par points (codage Bitmap)

Image
bitmap Pixellisation ou effet
d'escalier
Image
vectorielle

Toujours nettes à l’impression

26

13
08/11/2020

3.1 Images Vectorielles


• Description géométrique de l’image: des courbes mathématiques (dites de Bézier)
ou des droites décrivant des formes élémentaires (carré, cercle,...).
• Chaque forme possède un certain nombre d’attributs (couleur, épaisseur du trait,...)
• les formes sont éditables (modifiables) : points, tangentes, couleur de fond, couleur
de contour, style de contour, transparence..
• Stockage plus économique que celui d’une image matricielle.
• Codage particulièrement adapté pour les dessins techniques (composés de formes
géométriques ou de schémas).
☺Les logos sont généralement réalisé sous forme vectorielles.
☺Principaux formats (produits par les logiciels) : AI (Adobe Illustrator), SVG (SVG-
Edit ou Inkscape), EPS (compatible avec tous les logiciels d’édition graphique),
ODG (Draw)
27

3.2 Images matricielles


• Image codée par points (pixels)
• Le codage de chaque pixel se fait sur
– Un bit (noir et blanc)
– 2 bits (quatre nuances de gris)
– 4 bits (16 couleurs)
– 8 bits (256 couleurs)
– 16 bits (65536 couleurs)
– True color :
o 24 bits (plus de 16 millions de couleurs)
o Rajouter une information de transparence : 32 bits
Passage du bitmap au vectoriel: possible grâce à des algorithmes de vectorisation
Exemple: Soit une image, de dimension 19x14,2 cm scannée en 300 dpi et codée sur 24
bits. Quelle sera sa taille en octets?
Solution: Les 24 bits correspondent à 3 octets, L=300x(19/2.54) et H=300x(14.2/2.54)
28 La taille en octets=LxHx3octets= 2244 * 1677 * 3= 2.755Mo

14
08/11/2020

Formats de fichiers
Extension Nombre de Compression Commentaires
couleurs
BMP 16 M Non Format standard Windows
JPG 16 M Oui Format courant sur Internet
GIF 256 Oui Permet les animations ainsi que le mode
transparence. Très utilisé sur Internet
ICO 16 ou 256 Non Format des icônes sous Windows
TIFF 16 M Oui Utilisé en gestion de document.
PCX 16 M Non Ancien format (Paintbrush)
PNG 16 M Oui Concurrent libre du Gif
TGA 16 M Oui / Non Haute qualité adapté aux cartes Targa

Exemples de formats
i. Format d’échange graphique GIF (Graphic Interchange Format),
 Chaque image est précédée
o d’une signature (no de version, etc.),
o une définition d’écran
o et une échelle de couleur.
 Compressé avec l’algorithme LZW.
29  Facilité d’emploi + largement diffusé

ii. Format GIF,


 Chaque image possède une palette de 256 couleurs maximum.
 Chaque pixel est codé par l’indexe de la couleur dans la palette.
 Permet de réaliser de courtes animations tournant en boucle
iii. Format PNG (Portable Network Graphics) ,
 En plus de fonctionnalités de GIF, PNG devrait supporter:
o des images en couleur vraie de plus de 48 bits/pixel Gif animé
o un canal de texte (masque transparent) GIF et PNG conviennent les images
o des infos sur le gamma de l’image de type logo ou bande dessinée,
o un affichage progressif rapide
3.3 Images multispectrales, hyperspectrales
 Informations dans une multitude de bandes spectrales (plus de 200)
 Exemples d’images hyperspectrales
o Caractérisation quantitative des surfaces terrestres et de l'atmosphère
o Agriculture de précision à l’aide de la télédétection hyperspectrale

= + +…+
30

15
08/11/2020

3.4 Codage des couleurs


Système CIE RGB
• Proposé par la Commission Internationale de l‘Eclairage (1931).
• Fondé sur des expériences où on présente des stimulus de couleur à des personnes qui doivent
égaliser les couleurs.
• L'ensemble de ces couleurs s'appelle diagramme de chromaticité.
Diagramme de chromaticité
• Utilisé pour placer les points RVB des systèmes de synthèse des couleurs.
• Seules les couleurs situées dans ce triangle RVB peuvent être reconstituées.
• L'ensemble de ces couleurs s'appelle espace de couleurs ou gamut.
Gamut RGB
(écrans d'ordinateur) Gamut Adobe RGB

31

a) RGB (Rouge, Vert, Bleu)


• Le choix de trois couleurs primaires RVB est un résultat du système visuel
humain (Il y a trois types de cône: tri-stimulus)
• Ordinateurs et Télévision utilisent le codage RVB
• Par synthèse additive, on peut recomposer toutes les couleurs visibles
• Pour des applications de vision industrielle (télédétection, classification,…),
il est plus intéressant d'utiliser d’autres systèmes de codage
b) CMJN (Cyan, Magenta, Jaune, Noir )
• En imprimerie, la synthèse des couleurs étant soustractive, on utilise les trois
primaires de la peinture auxquels on ajoute le Noir (les 3 primaires ne donne
pas un noir satisfaisant). On travaille en quadrichromie.
• Le codage de base est le plus souvent en 32 bits (4××8).
• Peu de logiciels permettent le codage des couleurs directement en CMJN (ex.
Corel Draw)
(cyan, magenta,
La conversion RVB vers CMJN peut réserver des surprises car yellow, black (key))
32 certaines couleurs RVB ne pourront être correctement imprimées.

16
08/11/2020

c) Espaces de couleur TSV (HSV: Hue Saturation Value)


• Basé sur la Teinte, la Saturation, la Valeur
• Transformation non linéaire à partir de RVB, mais facile à calculer
• L’espace couleur TSV est
– Intuitif et facile à comprendre
– presque perceptif
• Bon spectre de couleurs pour la recherche de similarité
• Utilisé dans la norme MPEG-7 comme l’un des espaces de couleur
pour les descripteurs d’image Cylindre de couleurs TSV permet
de sélectionner rapidement des
multitudes de couleurs.

Espace RVB Espace HSV


R V B H S V

33

d) Espace XYZ
• Fondé sur des valeurs virtuelle X = 2,7689 R + 1,7518 G + 1,1301 B
• Idée de base: tous les couleurs peuvent être Y = 1,0000 R + 4,5907 G + 0,0601 B
présentée par des valeurs positives Z = 0,0000 R + 0,0565 G + 5,5943 B
– Y : luminosité
– X et Z : couleur
e) Espaces de couleur CIE (Lab)
• La CIE a proposé en 1976 l’espace Lab de transformation non linéaire des valeurs RVB:
– Aussi connu sous le nom L * a * b * ou CIELab
– L: luminance, L * = [0; 100]; (0 pour le noir à 100 pour le blanc)
– a *: les valeurs négatives indiquent le vert et les valeurs positives le magenta
– b *: les valeurs négatives indiquent le bleu, les valeurs positives le jaune
• CIE est basé sur l’opposition et la trichromatie
– Bleu-Jaune et Rouge-Vert
;  10 ∗ 8= > 
%  17.5 ∗    1.02 ∗   . >  / 8= >  
A  7 ∗   > .  0.847 ∗ D   / 8= >  
• Il est implémenté dans Photoshop et dans la plupart des systèmes de gestion des couleurs
34 Deux couleurs proches en distance le sont aussi pour l’œil

17
08/11/2020

3.5 Images en 3D
• Les images en 2D possèdent une représentation simple (bitmap ou
vectoriel),
• Les images en 3D sont plus complexes à manipuler,
– Pas de représentation standard, à cause de la diversité des sources
d’acquisition (scanneur 3D, modélisation 3D, imagerie médicale...).
– Le passage d’une représentation à une autre est complexe,
– Le choix de la forme de représentation doit être judicieux en fonction
du domaine d’application.
• Les formes de représentation des objets 3D sont classés en 2 catégories :
– Représentations volumétriques (voxels),
– Représentations surfaciques (vertexs).

Représentation Représentation
volumétrique Surfacique
35

Représentations volumétriques
Connue sous le nom de reconstruction multi-planaire (MPR: multi-planar reconstruction),
elles génèrent une approximation polyédrique (grille de voxels) d’un objet 3D.
Voxels : Grille uniforme d’échantillons volumétriques. L’acquisition se fait à l’aide de
CT (CAT Scan), MRI, ...

Empilement de Epaisseur de
coupes (images) chaque coupe

⊕ Information globale, visualisation directe.


⊕ Simple, rapide, parallélisable.
ϴ Compromis précision/complexité, transparence trompeuse.
36

18
08/11/2020

Approches surfaciques
Les formes de représentation surfacique peuvent être classés en 2 catégories :
Représentations basées sur des surfaces paramétriques,
Représentations non structurées (nuage de points, maillage triangulaire).

Surfaces paramétriques Nuage de points (vertexs) Maillage triangulaire


Représentation par Ensemble de points Ensemble de triangles (ou
subdivisions successives de appartenant à la surface de facettes) issus d'une
surfaces paramétriques l’objet à modéliser triangulation 3D des points.
⊕ Précis, Différentes représentations d’un lapin
⊕ Réduction des données,
ϴ Informations locales : nécessitent des connaissances préalables des données
37

Formats d’images 3D
• Selon le type d'application:
– Format Blender (.blend) pour la création Multimédia
– Format Pro/Engineer (.prt) pour la CAO industrielle
– Format OpenFlight (. FLT)pour la simulation de vol et/ou de conduite.
• Parmi les formats les plus répandus on peut citer :
– 3DS, DXF d'AutoCAD, BLEND de Blender
– IGES normalisé, X Direct 3D, OBJ de Wavefront
– LWO de LightWave 3D
– VRML de réalité virtuelle, avec ses versions (1, 2 et X3D) de Silicon Graphics.
– COB de TrueSpace.
• La tendance actuelle est de privilégier le format descriptif de type X3D (évolution
du VRML avec un formatage XML).
• L’un des critères de choix des modeleurs 3D est de pouvoir lire (Import) et créer
(Export) plusieurs formats.
38 • Le format libre COLLADA permet d'échanger des données entre différents logiciels.

19
08/11/2020

Kinect: Capteur 3D par triangulation


2009: Annoncée par Microsoft, Kinect est un périphérique pour contrôler des jeux vidéo
sans utiliser de manette (interaction par le corps: Party games ). Il permet d’interagir
par commande vocale, reconnaissance de mouvement et d’image.
Capteurs de profondeur (technologie infrarouge)
permet d’utiliser Kinect dans le noir.

Micro à
reconnaissance Caméra RVB
vocale Moteurs permettant l’orientation
verticale de la tête de Kinect

Party games ou jeu vidéo de fête


2012: Kinect pour PC inclut un kit de développement pour
permettre aux développeurs de créer leurs propres
applications (fonctionnel à partir d’une distance de 50 cm)
39

3.6 Holographie numérique: enregistrement d’un volume


In-line Plaque Holographique

Enregistrement

40
Restitution

20
08/11/2020

4. Composant Vidéo
• Séquence d'images diffusées à un taux constant (par ex. 24 img/sec).
• Comment encoder une vidéo ?
• Utilisation de la redondance
o Au sein d'une image (dans un ciel, deux pixels différent peu...)
 Au lieu d'envoyer n pixels identiques, on envoie 2 valeurs : la
couleur et le nombre de répétitions... Image i
o Entre deux images (peu de différences dans un même plan). Image i+1
• Codage des différences pour limiter le nombre de bits nécessaires.
Encodage vidéo
• Entrelacé (i) :
o Doubler le nombre d'images par seconde perçues avec le même débit.
 Une fois les lignes paires, une fois les lignes impaires.
• Progressif (p) :
o Toutes les lignes en même temps.
41  720p vs 1080i par exemple.

Codage Vidéo
•Normes Vidéo de 1èregénération – MPEG- 2/H.262
– JPEG et Motion JPEG • Normes Vidéo de 3ème Génération
– H.261 – MPEG-4 partie 2
– MPEG-1 – MPEG-4 AVC/H.264 partie 10
• Normes Vidéo de 2ème Génération – MPEG-7
– H.263 (H.263+) – MPEG - 21
Applications
• Le Streaming
Trois grands types d'applications possibles:
1. Streaming stocké (audio, vidéo) : Youtube, Netflix, télévision en replay...
o Peut être joué avant d’être entièrement téléchargé.
o Stocké sur un serveur (peut être envoyé plus rapidement que reçu : nécessite un
buffer côté client) (ou P2P (Spotify)),
2. Conversations (audio/vidéo sur IP): Skype, Google...
3. Streaming live audio/vidéo : Sopcast, Twitch...
42

21
08/11/2020

Conteneur Conteneur (AVI, QT, ASF, MP4…)

• Rôle : réunir le son et l’image Vidéo Audio Divers


(DivX, (MP3, -Chapitres
• Contient en plus des informations diverses: XVid, WMA, …) -Sous titres
Chapitres, Menus, Sous titres, etc… MPEG…) - Menus
Formats de conteneurs - Méta données
-…
• AVI : le plus répandu, crée par Microsoft pour Windows
– Peut contenir tout type de fichier audio et vidéo, mais pas de textes
– Pas de chapitres (1 seule piste vidéo)
– Doublage multilingue (jusqu’à 99 pistes audio)
– Format très répandu, fonctionne sur tous les lecteurs vidéo
• QuickTime : le plus souple, crée par Apple
– Peut contenir des pistes audio, vidéo, et des textes (pour les sous titres)
– Une piste peut être également un stream (diffusion en temps réel par internet)
– Nécessite le lecteur Quicktime
43

Formats de conteneurs
• ASF : le plus prometteur, format récent développé par Microsoft
– Supporte tous les formats audio et vidéo
– AVI amélioré : plusieurs pistes audio, vidéo et texte
– Très utilisé pour le streaming par internet
– Compatible avec les DRM (gestion des droits numérique)
– Format utilisé sur les successeurs du DVD : Blu-Ray et HD-DVD
• RealMedia: en perte de vitesse, développé par RealNetworks
– Supporte de nombreux formats (spécialement les formats Real Audio et Real Movie)
– Adapté au streaming
– Supporte uniquement le CBR (Constant Bit Rate) Mauvaise compression des données
– De plus en plus délaissé au profit des formats ASF et Quicktime
– Lecture uniquement avec RealPlayer, souvent jugé trop intrusif.
• MP4: Quicktime amélioré, utilisé pour les DivX. Très souple, peut contenir des images.
• 3GP: Dérivé du MP4 pour les téléphones mobiles.
44

22
08/11/2020

Nom Compatibilité Pistes Pistes Sous titres Possibilité de Possibilité


vidéo audio streaming de DRM
AVI  1 99 Non Non Non
QuickTime  infini infini Oui Oui Oui
ASF  infini infini Oui Oui Oui
RealMedia  1 1 Non Oui Oui
MP4  infini infini Oui Oui Oui
3GP  1 1 Non Oui Oui
Récapitulatif des conteneurs
Autres formats des vidéos
• MPEG-2: Format le plus répandu,
– Compression peu performante, adaptée aux résolutions standards mais pas à la HD
– Format du DVD : Compatible avec tous les logiciels et les platines DVD.
• DivX: Format récent, moins répandu,
– Compression très performante (jusqu’à 7 fois plus efficace que le MPEG-2)
– Compatible avec la plupart des logiciels, et les platines DVD récentes.
• XviD: Format basé sur le DivX, mais non compatible,
– Crée pour des raisons de propriété intellectuelle (format libre)
45 – Compatible avec peu de logiciels et très peu de platines DVD.

Les formats de fichiers Multimédias


Catégorie Formats
Images PNG, MNG, TIFF, JPEG, GIF, TGA, OpenEXR, BMP
Dessin vectoriel VML, SVG, Silverlight, SWF, AI, EPS, DXF
XCF, BLEND, SKP, (SKB), DXF, 3DS, Max, C4D,
3D
VRML, X3D, IFC, DWG
Son OGG, FLAC, MP3, WAV, WMA, AAC
Vidéo MPEG, OGM(DVD, DivX, XviD), AVI, Theora, FLV
Page PDF, PostScript, HTML, XHTML, XML, PHP
Document de traitement de texte ODT, TXT, DOC, RTF
Exécutable BIN, ELF, EXE, SDC, BAT
Archives (fichier compressé) 7Z, TAR, GZIP, ZIP, LZW, ARJ, RAR, SDC

46

23
08/11/2020

5. Autres types de médias


• Basé sur le type de récepteur
– Support visuel / optique
– Supports acoustiques
– Support haptique - à travers les sens tactiles
– Support odorant - à travers l'odeur
– Support gustatif - à travers le goût
• basé sur le temps
– Dynamique
– Statique
Supports de transmission?
• Un transporteur d'informations à travers une connexion de communication
• Il est indépendant de l'information transportée
• Le support utilisé peut être changé lors du transfert d'informations
47

24

Vous aimerez peut-être aussi