Digital lyd er en repræsentation af lyd i digital form, hvor den kontinuerlige analoge lydbølge omdannes til en række binære værdier (1'er og 0'er) gennem processerne sampling. Digital lyd bruges i formater som MP3, CD-lyd og streamingtjenester.
Når der oprettes en digital optagelse fra en analog kilde, er samplingfrekvensen tidsintervallet mellem samplinger, og jo højere det er, desto mindre går der tabt. CD-lyd har f.eks. en standardsamplingfrekvens på 44,1 kHz, hvilket betyder, at der tages 44.100 samplinger hvert sekund. Generelt betyder en højere samplingsfrekvens en højere optagelseskvalitet. Hi-Res Audio (lyd i høj kvalitet) har en samplingfrekvens på 96 kHz eller derover og en bitdybde på mindst 24 bit.
Nyquist-Shannon Sampling Theorem siger, at for at digitalisere et analogt signal uden tab af information, skal samplingsfrekvensen være mindst dobbelt så høj som den højeste frekvens i signalet. Dette sikrer, at det originale signal kan genskabes nøjagtigt fra de digitale samples. Eksempelvis Hvis en lyd har en højeste frekvenskomponent på 20 kHz, skal den samples med mindst 40 kHz (to gange 20 kHz) for at sikre, at signalet kan genskabes præcist. Derfor er standard samplingsfrekvensen for CD-lyd 44.1 kHz, som er lidt over det dobbelte af 20 kHz. Hvis samplingsfrekvensen er for lav, opstår der forvrængning kaldet aliasing, hvor høje frekvenser fejlagtigt repræsenteres som lavere frekvenser.
Digital lyd har en simpel process på overfladen, herved forklare jeg den, udefra billedet under.
Optagelse af lyd
På venstre side af billedet er der en person, der taler, og lyden bliver opfanget af en mikrofon (vist ved ikonet ved siden af personen). Mikrofonen omdanner den analoge lyd (lydbølger) til et elektrisk signal, som derefter sendes videre til næste trin.
Digitalisering
Det elektriske signal, som kommer fra mikrofonen, sendes til en enhed (vist som en rektangulær boks med en chip i midten). Denne enhed digitaliserer det analoge signal ved at konvertere det til binære data (1'er og 0'er). Her bliver den analoge lydbølge repræsenteret som digitale værdier.
Opbevaring/Behandling
Den digitaliserede lyd kan enten gemmes på en lagringsenhed (vist som en harddisk i midten) eller behandles videre af processoren (vist som en chip med binære data). Hvis den lagres, kan den senere blive hentet til yderligere behandling eller afspilning.
Konvertering tilbage til analog lyd
Når de digitale data skal afspilles, bliver de sendt tilbage gennem en digital-til-analog konverter (vist som en rektangulær boks på højre side af chippen). Her konverteres de binære data tilbage til en analog lyd, som kan sendes til en højttaler.
Afspilning
Den analoge lyd signal sendes til højttalere (vist ved ikonet for en højttaler og mennesker på højre side af billedet). Højttaleren konverterer det elektriske signal tilbage til lydbølger, som kan høres af mennesker.
Formater
PCM (Pulse-Code Modulation): PCM er en digital repræsentation af analoge lydsignaler, som optages ved at tage prøver (samples) af lydbølgerne på bestemte tidspunkter. Det er det mest præcise format, men fylder meget plads. PCM er almindeligt brugt på CD'er og DVD'er.
WAV (Waveform Audio File Format): WAV er udviklet af Microsoft og IBM som et format til Windows-systemer. Det bruges ofte til ukomprimeret lyd i PCM-format, selvom det også kan indeholde komprimeret lyd. WAV-filer bruges primært på Windows, men kan også afspilles på Mac.
AIFF (Audio Interchange File Format): AIFF er Apples svar på WAV og bruges hovedsageligt på Mac-systemer. Ligesom WAV indeholder AIFF-filer ofte ukomprimeret lyd i PCM-format. Der findes også en komprimeret version kaldet AIFF-C.
MP3 (MPEG-1 Audio Layer 3): MP3 er det mest populære lydformat og er kendt for sin evne til at reducere filstørrelsen ved at fjerne lyde, som ikke er let hørbare for mennesker. Næsten alle enheder kan afspille MP3-filer.
AAC (Advanced Audio Coding): AAC er efterfølgeren til MP3 og bruger en mere avanceret komprimeringsalgoritme, hvilket giver bedre lydkvalitet ved samme bitrate. Det bruges som standard på YouTube, iTunes, iOS og Android.
OGG (Vorbis): OGG er en container, der typisk bruges til at holde Vorbis-lydfiler, som er kendt for at levere bedre komprimering end MP3 og AAC. Det er open-source, men ikke så udbredt på grund af begrænset enhedsunderstøttelse.
WMA (Windows Media Audio): WMA er udviklet af Microsoft og har til formål at forbedre kompressionen i forhold til MP3. Selvom det giver bedre lydkvalitet, er det ikke så udbredt på grund af begrænset understøttelse på tværs af platforme.
FLAC (Free Lossless Audio Codec): FLAC kan komprimere lydfiler op til 60% uden at miste nogen data. Det er open-source og royalty-frit, og er en populær erstatning for MP3, da det bevarer lydkvaliteten fra den oprindelige optagelse.
ALAC (Apple Lossless Audio Codec): ALAC er Apples tabsfri komprimeringsformat, der ligner FLAC, men er mindre effektivt i komprimeringen. Det bruges primært af Apple-enheder, da iTunes og iOS ikke understøtter FLAC.
WMA Lossless: Dette er en tabsfri version af WMA-formatet, men det er mindre effektivt end FLAC og ALAC i komprimeringen. WMA Lossless understøttes af Windows og Mac, men har begrænset hardwareunderstøttelse.
Efter at have ændret dens Sampling fra 22050 til 8000 får den en slow-mo effekt, hvilket også giver mening, da det er den samme længde men blot med mindre samples, og hermed har den også dårligere kvalitet. Nedeunder kan man høre foreskellen:
(Venstre 8000Hz, Højre 22050Hz)