Codificació de imatge, vídeo i so

A l'apartat anterior hem vist com s'introdueix el bit per tal de codificar nombres o text, i com aquests bits s'agafen de 8 en 8 formant bytes que donen lloc a 256 combinacions possibles (poden codificar 256 elements com lletres).

L'explicació d'aquest fet és pura combinatòria. Suposa que agafes els bits d'un en un, quants valors possibles té un bit?

1 bit: 0 i 1 (2 valors)

Això vol dir que amb un bit només podriem codificar les lletres A i B! El problema és que resulta que en tenim moltes més...

La pregunta ara és, quantes combinacions existeixen (i per tant, quants elements podriem codificar) si agafem els bits de 2 en 2 o de 3 en 3?

2 bits:

22=4

3 bits:

23=8

4 bits:

24=16

La resposta a aquesta pregunta es pot trobar de dues formes:

  • Amb llàpis i paper escribint totes les possibilitats (aquest és el mètode matxaca!).
  • Fixant-nos en que el resultat sempre és igual a 2 (nombre de símbols del codi binari) elevat al nombre de bits que agafam.

Per tant, per a 5 bits les combinacions possibles seran 25=32, per a 6, 26=64,...

És evident que per a lletres i símbols el nombre de bits no caldrà que sigui massa gran (codi ASCII o UNICODE), però que passa amb altres tipus d'informació que també ens interessa codificar?

Codificació de la imatge

Exactament el mateix raonament que es segueix per als símbols es pot utilitzar per a les imatges. La diferència ara serà que el que pretenem codificar són els colors de cadascún dels pixels. La pregunta per tant és "quants bits necessitam per codificar suficients colors com per a que la imatge sigui el més real possible?". La resposta a aquesta pregunta té que veure amb la sensibilitat de l'ull, que és un organ capaç de percebre milions de colors, per tant necessitarem un nombre de combinacions bastant més gran que per a símbols.

D'altra banda, també necessitam entendre que el color a cada punt de la pantalla (pixel) es genera igual que amb els pinzells: barrejant colors primaris. En particular, es fa servir el sistema RGB (Red-Green-Blue) que combina 3 colors primaris (es diu que té 3 canals).

Per tal de visualitzar la diferència amb el nombre de bits d'una mateixa imatge, el que s'anomena profunditat de color, vegem el següent exemple:

Imatge

Nombre de bits




1 bit de color








3 bits de color








4 bits de color






8 bits de color







24 bits de color

(8 bits per canal)




Nombre de colors



21=2 colors

(conegut com monocromo)







23=8 colors








24=16 colors





28=256 colors

(el format gif fa servir aquest estàndar)






224=16.777.216 colors

(formats com bmp, jpg, png...)

Amb 24 bits de color, la quantitat de colors possibles ja és lleugerament superior als que pot distingir l'ull humà, pel que als 24 bits se'ls anomena color real ("true color").

Encara així, per a tractament avançat de la imatge digital, és freqüent fer feina amb una quantitat superior de bits. Per exemple, es poden trobar els formats RAW i NEF de les càmeres rèflex digitals que utilitzen fins a 16 bits per canal (48 bits de color = 2,814749767×10¹⁴ colors), i el format propi de Photoshop (Psd) amb 32 bits per canal...

A la següent taula es pot veure la correspondència entre els colors possibles amb 24 bits i el seu codi.

Cal destacar que a la imatge anterior no estan tots els colors possibles, ja que són més de 16 milions de colors, i que el codi no està escrit en binari perquè són 24 bits per a cadascún d'ells (la taula seria molt llarga!). El que es fa és fer servir el codi hexadecimal que utilitza 16 símbols (0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F) per així, amb dos dígits, poder representar les 256 variants que hi ha per canal (6 dígits per a cada canal).

A més, s'ha de dir que la majoria dels formats de imatge fan servir la compressió de dades, pel que la mida del fitxer final serà menor que la suma dels bits. Un format sense compressió de dades és el bmp i un amb compressió és el jpg.

Codificació del vídeo

Una vegada s'ha entès la codificació digital de la imatge, imaginar el funcionament bàsic del vídeo digital no és complicat. N'hi ha prou amb saber que un vídeo és una successió de imatges que passan molt ràpid per la pantalla generant la sensació de moviment.

Els ritmes de canvi d'una imatge a la següent varien en funció de la tecnologia utilitzada i van des de 24 fotogrames per segon (fps) al cinema tradicional, fins a 5000 fps a algunes càmeras d'acció modernes. Amb aquestes velocitats s'aconsegueixen vídeos hiperreals i també càmeras lentes molt espectaculars.

S'ha de dir que els formats de vídeo digital no només acumulen imatges per seqüenciar-les a altes velocitats, sino que fan servir algoritmes de compressió per tal de reduir la mida de l'arxiu mantenint al màxim la qualitat de la imatge.

Codificació del so

El procés de digitalització del so consisteix en fer una cosa molt semblant al que es fa amb el vídeo, però ara es canvien els colors per sons, freqüencies, notes... Quants més bits es fan servir per aquesta codificació, més varietat de sons es poden reproduir (16 bits és l'estàndard dels CD's, 216=65536 sons diferents) i quantes més vegades es canvia de so en un segon, més qualitat tindrà l'arxiu resultant (MP3 fa servir 16, 22.05 i 24 kHz segons la qualitat).

Aquesta codificació del so es pot estudiar amb més detall aquí.

Exercicis:

  1. Per acabar d'entendre com funcionan les imatges digitals, descarrega el següent arxiu. Dins d'ell trobaràs un exercici al que es simula una imatge de 18x18 píxels als que has de donar color fent servir la codificació correcta. Fes una captura de pantalla de la imatge resultant i insereix-la al document de resposta d'aquests exercicis.
  2. Imagina que tens un arxiu de imatge bmp (sense compressió) que fa servir 8 bits per canal i que té 800x600 píxels. Calcula la mida del fitxer en bits i en Bytes.
  3. Descarrega una imatge qualsevol des d'internet. Obté de les seves propietats la seva mida, el nombre de píxels en horitzontal i vertical i el seu format. Quants de bits per canal fa servir? Quants de colors es poden representar en aquest format?
  4. Imagina que visualitzes la imatge anterior en un monitor que fa 47x27cm. Quina serà la mida en cm de la imatge en pantalla si està configurada amb les següents resolucions:
    1. 800x600:
    2. 1024x768:
    3. 1920x1080:
  5. Cerca informació de la resolució i els fotogrames per segon dels formats: "MPEG-1", "MPEG-2", "MPEG-4", "flv", "HD", "Full HD" i "4K"?
  6. Quin penses que és el principal problema a l'hora de transmetre vídeos a una resolució cada vegada més elevada?
  7. Quines són les característiques dels vídeos que s'empaqueten en "DVD" i en "Blu-Ray"?