Os conteúdos a transmitir no sistema IPTV incluem som e vídeo que pode ser de grande definição, a transmissão destes conteúdos no seu estado “puro”, isto é, sem qualquer processamento após a aquisição dos sinais em formato digital, não seria compatível com as formas de transmissão existentes, devido ao seu elevado rate.
Atualmente, os conteúdos IPTV são codificados pelas normas MPEG, as diferentes versões desta norma têm diferentes objetivos e diferentes capacidades, mas assentam nos mesmos conceitos fundamentais de compressão, que são a irrelevância e a redundância.
A irrelevância está relacionada com a perceção humana, em que eliminam componentes, tantos de uma imagem como do som, que não são facilmente detetados à visão (ex: variações de alta frequência) ou à audição humana (ex: frequências fora do intervalo 20 Hz a 20 kHz, figura 5), poupando assim significativamente o tamanho do conteúdo.
Figura 5: Limites e valores para a deteção de frequências pelo sistema humano (varia com idade)
Vídeo 4: O efeito de Masking é explorado para a compressão de áudio
A redundância numa imagem pode ser espacial (com recurso a uma transformada para o domínio da frequência), ou estatística (codifica-se com palavras mais pequenas os símbolos mais frequentes). No vídeo há redundância temporal, em que se pode codificar um frame baseado nas diferenças em relação a outros frames.
A figura 6 compara o desempenho de alguns padrões de codificação. MPEG-2, ao contrário dos mais recentes, não foi desenvolvido tendo em conta os serviços de streaming, logo é natural uma crescente presença de normas mais avançadas como MPEG-4 que já têm em conta a transmissão pela internet.
Vídeo 5: Uma técnica usada para a codificação multimédia é a DCT (Discrete Cosine Transform)
Figura 6: Comparação da relação máxima de sinal ruído entre MPEG-2, MPEG-4 e H.264/SVC