Filformater og komprimering

Enkelt sagt er filformater sekvenser av data som brukes for å kode digital informasjon ut fra bestemte regler. Selv om de er strukturert på ulike måter, vil digitale mediefiler vanligvis begynne med en innledende "hode"-del etterfulgt av en "kropp", som inneholder de fleste av dataene. I tidsbaserte mediefiler er denne strukturen ofte beskrevet som "wrapper" format (konvolutten som holder ulike elementene sammen, slik som video, lyd og tilhørende metadata) og "kodek" (kompresjon-dekompresjon algoritme) som er språket som brukes til å kodeselve medieinnholdet. Det er viktig å huske på skillet mellom filformat og type komprimering som brukes, da det hele noen ganger kan virke forvirrende. Filnavn ender med en forlengelse (vanligvis tre bokstaver, som .avi, .wav eller .tif), noe som hjelper dataprogrammer til å gjenkjenne dem, men samme komprimering kan brukes for flere filformater.Komprimering

Mediefiler kan være svært store, og komprimering er en måte å kode datamengden i en fil mer konsist og effektivt. En

komprimeringsalgoritme er en bestemt serie av trinn som kreves for å utføre en gitt oppgave (i dette tilfellet å redusere filstørrelsen). En komprimeringsalgoritme kan enten være "lossy": Informasjon blir tatt vekk for å redusere filstørrelsen og/eller båndbredde, eller den kan være "lossless": ikke noe informasjon blir ugjenkallelig ødelagt

Komprimering kan spare plass eller gjøre distribusjon enklere, men dete kan også forsinke åpningen av filen, siden den må dekomprimeres når den åpnes. Mange former for komprimering vil også redusere kvaliteten av innholdet i filen. Dette fordi informasjon utelates, for på den måten å redusere størrelsen.

Lossless (tapsfri) og lossy (med tap)

Hovedpoenget for lossless komprimering er at ikke noe informasjon er ugjenkallelig tapt i prosessen. Det vanlige .zip-formatet er et eksempel på tapsfri komprimering. Når det brukes til å "zippe" en samling av tekstdokumenter, vil nøyaktig de samme dokumentene rekonstrueres hver gang de 'pakkes opp'

Lossy kompresjoner omformer og forenkler mediainformasjon på en måte som gir mye større reduksjoner i filstørrelse enn lossless kompresjon. En typisk tapsfri komprimering kan forventes å kutte filstørrelser ned til tre fjerdedeler eller to tredjedeler av den opprinnelige - kanskje til det halve, hvis den er veldig effektiv. I kontrast kan en lossy komprimering redusere filstørrelsen til så lite som 1% av den opprinnelige størrelsen, men mindre enn 10% vil sannsynligvis forvrenge innholdet i filen. Ulempen er imidlertid at en lossy komprimering per definisjon er ugjenkallelig, den ødelegger for alltid en del av informasjonen.

Noen digitale videokompressorer som MPEG-2 har et ekstra trick i ermet, ved at den forenkler de visuelle data i hver bilderute i videoen (intraframe komprimering). Forenkling skjer også på tvers av bilderutene (interframe komprimering). Så hvis en person blir stående stille over flere bilderuter, vil pikslene som utgjør karakteren ikke "oppdateres" mellom hver rute. I stedet vil de forbli stasjonære til karakteren beveger seg igjen. I praksis blir den del av videoen et statisk digitalt fotografi inntil en endring er nødvendig. Denne taktikken gjør lossy videokodeker mer effektive.

Enkelte komprimeringsteknikker for lyddata bruker en intelligent tilnærming basert på modeller for menneskelig lytting og innholdet i lydfilen. Data om frekvenser som enten er minimalt tilstede (eller ikke tilstede) i en lydfil, eller de som det menneskelige øret ikke er spesielt lydhør overfor, fjernes ved hjelp av matematiske algoritmer. Denne reduksjonen av hørbart innhold blir særlig merkbar når du lytter til sterkt komprimerte lydfiler som MP3-filer med lav bithastighet, hvor de lydmessige kvalitetene er drastisk forandret gjennom tap av mer informasjon på flere og flere frekvenser.

La oss se på det relativt enkle eksemplet med den lossy, digitale bildekompressoren JPEG. JPEG gjør bruk av en matematisk omforming til å forenkle bildets fargeverdier til en form som kan bli mer effektivt komprimert og kodet. JPEG-kvaliteten bestemmer hvor stor forenklingen skal være.

Diagrammet viser de viktigste trinnene i en lossy komprimering Disse trinnene er reversert når bildet vises (dekomprimeres).

Fordi de er laget for å ta vekk informasjon, vil lossy kompresjonsmetoder alltid kunne oppnå en mye større komprimeringsgrad enn ved lossless komprimering. Dette gjør dem mest egnet for tilfeller der størrelsen er mer avgjørende enn kvaliteten, for eksempel ved streaming eller nedlasting via Internett. Der kvalitet blir mer verdsatt eller filstørrelse ikke er noe problem, vil man foretrekke lossless komprimering - eller ingen komprimering i det hele tatt. Digitale videoformater Det finnes et stort antall filformater for arkivering av video, remastering eller for vanlig visning. Ulike filformater har forskjellige egenskaper og er dermed egnet til ulike formål. For eksempel vil argumenter om åpen kildekode framfor proprietære formater ikke være så kritisk for visning, forutsatt at formatet kan spilles av hos flest mulig av brukerne. Filstørrelse og nødvendig båndbredde (dvs. data hastighet) vil i større grad være begrensende faktorer når du velger et filformat for visning. For eksempel er på nåværende tidspunkt H.264-formatet (MPEG-4) i stor framvekst som et leveringsformat. Skal du derimot velge et format for arkivering vil fremtidig støtte for formatet og kvalitet gjerne teller mer enn filstørrelse og kompabilitet med de mest brukte medieavspillerne. Forskjellige formater bruker forskjellige "triks" for å redusere filstørrelse og båndbredde og redusere forringelsen av bildet. Om disse reduksjonene i visuell presisjon er akseptable, avhenger veldig mye av formålet videoen skal benyttes til. En digital videofil består av en såkalt "kontainer” og en "kodek". Man kan se på en kontainer som en innpakning som kan inneholde elementer som video, lyd og metadata (instruksjoner om hvordan filen skal brukes, hva den inneholder, hvor lang den er mm).

Vanlige kontainer-formater:

Videodelen av disse dataene blir vanligvis kodet med en bestemt "kodek" (kompresjon-dekompresjon algoritme).

En kodek kan enten være "lossy' - det vil si at informasjon er utelatt for å redusere filstørrelsen og / eller båndbredde eller 'lossless' - ingen informasjon blir utelatt. Kun noen få profesjonelle kameraer tar opp video i et tapsfritt format.

Vanlige kodeker:

Wikipedia har en omfattende liste over kodeker http://en.wikipedia.org/wiki/Comparison_of_video_codecs#Codecs_list

Både wrapperne og kodekene har blitt videreutviklet og forbedret etter hvert som digital video har erstattet analog video. Forskjellige avspillere og redigeringsverktøy foretrekker imidlertid ulike typer filer. De oppgavene som programvaren brukes til (for eksempel redigering eller støyfjerning) påvirker vanligvis også valg av de filformatene som brukes.

Opptaksformater

Under opptak har vi gjerne ikke så mange valgmuligheter, siden de enkelte kameraene kun støtter noen få formater og kodeker, men i det videre arbeidet kan vi bli nødt til å forholde oss til en rekke forskjellige filformater for digital video. Å velge riktig filformat kan lett bli en forvirrende oppgave. Nedenfor tar vi opp noen forhold som du bør ta hensyn til før du velger et filformat, men artikkelen går på ingen måte i dybden i forhold til disse spørsmålene.

Filformat for innspilling av nytt videomateriale er som oftest avhengig av den typen kamera som brukes. De aller fleste kameraer kun støtte for noen få filtyper. Før du velger et format for innspilling, bør du likevel ha tenkt gjennom fremtidig bruk av opptakene.

For forbruker- og halvprofesjonelt kamerautstyr vil bare lossy opptak være mulig. Videokameraer som lagrer på tape vil typisk benytte formater som HDCAM eller HDV for HD-materiale.

De fleste kameraer med opptak til små minnekort lar deg velge avarter av MPEG-4 og AVCHD, eller MJPEG, MOV og AVI. 

AVCHD er et format som komprimerer mye før den digitale informasjonen skrives til minnekortet, og som dermed også er ganske krevende å dekode. Dette gjelder i praksis alle MPEG-4-variantene, særlig når kompresjonsgraden er høy. Dersom du opplever at streamet video hakker trenger det ikke bety at det båndbredden som er problemet, det kan også være maskinen du benytter som ikke er kraftig nok til å dekode videoinformasjonen raskt nok. 

Velger du å la kameraet ta opp i MJPEG, MOV og AVI er gjerne dette mindre krevende for maskinvaren som skal kode og dekode, men fører dermed også til lavere kompresjonsgrad.

Åpne og proprietære (lukkede) format

En skiller gjerne mellom "åpne" formater, som kan støttes av alle programvareleveandører og "proprietære" formater, som er eid av en produsent eller en gruppe av produsenter. For å benytte et proprietært format må en produsent vanligvis akseptere en avtale, som begrenser hvordan teknologien kan brukes på lovlig via. En gitt wrapper eller kodek vil enten være åpen eller proprietær.

Et prosjekt som ikke trenger å ta hensyn til framtidig bevaring, trenger ikke vurdere langsiktige de konsekvenser av å bruke et proprietært format. Men det kan alltid være lurt å holde seg til standardformater, siden det gir økt tilgjengelighet for brukerne. Bruk åpne formater åpne formater når det er praktisk mulig. Ser vi på de anbefalte dokumentformatene for offentlige nettsteder finner vi at disse i praksis ikke blir implementert når det gjelder videofiler. Dette fordi det gjerne viser seg å være mer formålstjenlig å benytte dedikerte videotjenester, som YouTube og Vimeo,  som publiserer i formater som de aller fleste brukerne kan nyttegjøre seg. 

Effektiv komprimering og god funksjonalitet er viktig i digitale formater, spesielt når du redigerer eller leverer. Men disse teknologiene er ofte proprietære, kontrollert av patenter relatert til kommersielle bildebehandlingsprodukter eller bundet opp til opphavsrett. En har sett eksempler på at støtten til et bestemt format har forsvunnet, noe som gjør tilgang til medieinnholdet komplisert, i verste fall umulig.

Selv om det da kan virke fornuftig alltid og kun bruke åpne standarder som ikke er knyttet til en enkeltprodusent eller en gruppe av produsenter, er det ikke alltid like enkelt. Visse funksjoner kan bare være tilgjengelig innen proprietære formater. En åpen standard tar som regel lang tid å utvikle, med innspill fra mange interessenter, og en kan ende opp med en situasjon der ulike programvareløsninger favoriserer litt forskjellige funksjoner.

Et proprietært filformat har gjerne færre problemer når det introduseres, men det kan forutsette bruk av ett bestemt program. Dermed blir formatet knyttet til økonomien i et kommersielt selskap, er formatet blir dermed sårbart for å bli endret eller droppet uten hensyn til brukerne.