Sonido digital. Los formatos y su captura.

Captura y digitalización de sonido.

-Captura de audio desde una grabadora

La mayoría de este tipo de dispositivos, incorporados ahora en los reproductores MP3, permiten la grabación en formato WAV y WMA. Los archivos generados pueden transferirse al disco duro haciendo uso de un cable USB, que posibilitará ver la grabadora como una unidad de almacenamiento externo.

-En caso de que el dispositivo solo permita grabación en formato WMA, será necesario

utilizar un conversor a formato WAV, como por ejemplo el WMA2WAV1, u otras

herramientas más genéricas capaces de convertir muchos tipos de información multimedia,

como mplayer/mencoder.

Captura de audio digital desde un CD-Audio y conversión a formato WAV

- Para convertir a formato WAV el formato CDA original de los archivos que contiene un

Compact Disc existen multitud de programas. Uno de ellos es CDex3, que permite además

efectuar compresión MP3.

-El manejo del programa anterior es totalmente intuitivo. Introducimos el CD, aparecen

todas las pistas disponibles, seleccionamos las que queramos y las convertimos a formato

WAV mediante la primera opción del menú Convert. La carpeta del disco duro del

computador donde se almacenan los archivos WAV puede especificarse mediante

Options/Settings/Filenames.

2Digitalización: Digitalización del sonido La digitalización del sonido es el proceso que realiza el ordenador: convertir la señal analógica de los sonidos en señal digital. La digitalización de un sonido supone tomar muestras de la señal sonora cada cierto tiempo y medir la intensidad de la señal analógica.

3Micrófono: Los micrófonos son usados en diferentes aplicaciones como teléfonos, grabadoras, audífonos, producción de películas, ingeniería de grabación de audio, en transmisión de radio y televisión, en grabación en computadoras, en VoIP, captar el ultrasonido o el infrasonido, etc.
Con respecto a los micrófonos que se conectan a las computadoras, se consideran dispsitivos periféricos de entrada.

4Codificación a soporte digital:Los algoritmos de compresión de audio se fundamentan en aspectos perceptibles al oído humano. Básicamente son dos los fenómenos que son objeto de estudio y que han originado los métodos de compresión: la curva de sensibilidad del oído y el fenómeno de enmascaramiento.

El oído humano detecta sonidos entre 20Hz y 20KHz. Pero su sensibilidad depende de la frecuencia del sonido, de esta forma, dos frecuencias con la misma potencia son interpretadas por nuestro oído de forma diferente, teniendo la sensación de que una es más fuerte que otra, o incluso, oír una y no la otra. La curva que indica cual es la potencia mínima (umbral) que nuestro oído detecta es la curva de sensibilidad:

Curva de sensibilidad (típica) del oído:

Podemos observar que nuestro oído es muy sensible a frecuencias entre 2 y 4KHz (aproximadamente). Además observamos que si la potencia de una cierta frecuencia no supera el umbral de la sensibilidad del oído, simplemente no la oiremos, por lo tanto no hace falta que la codifiquemos. Este es un primer paso en la compresión: eliminar las señales que no oiremos. Existe otro tipo de señales que tampoco oímos: aquellas que son enmascaradas. Imaginemos una señal de 1KHz con un potencia tal que supera el umbral y que, por lo tanto, oímos. Si aparece de forma simultanea otra señal de 0.5KHz y vamos aumentando su potencia llegará un instante en el que no oiremos la señal de 1KHz ya que ha sido enmascarada. Esto se debe a que la potencia de una señal hace que la sensibilidad del oído varíe, necesitando más potencia de las señales próximas enfrecuencia para poder oírlas.ElementosFenómeno de enmascaramiento:

El enmascaramiento gana importancia cuando los sonidos son cercanos en frecuencia y la frecuencia enmascaradora es inferior que la enmascarada. Para poder cuantificar el fenómeno de enmascaramiento surge el concepto de banda crítica como el ancho de banda máxima alrededor de una frecuencia para que no haya enmascaramiento, por lo tanto, sólo se produce éste entre bandas contiguas. Además, estas bandas están distribuidas siguiendo una escala logarítmica, simulando la escala perceptiva del oído. Una escala de medida perceptual es la escala BARK que relaciona las frecuencias acústicas con la resolución perceptual de éstas.

5Equipo reproductor digital:

MP3 es un formato de compresión de audio digital patentado que usa un algoritmo con pérdida para conseguir un menor tamaño de archivo. Es un formato de audio común usado para música tanto en ordenadores como en reproductores de audio portátil. Fue desarrollado por el Moving Picture Experts Group (MPEG) para formar parte del estándar MPEG-1 y del posterior y más extendido MPEG-2. Un MP3 creado usando una compresión de 128kbit/s tendrá un tamaño de aproximadamente unas 11 veces menor que su homónimo en CD. Un MP3 también puede comprimirse usando una mayor o menor tasa de bits por segundo, resultando directamente en su mayor o menor calidad de audio final, así como en el tamaño del archivo resultante.

6Altavoces:

El altavoz es un dispositivo utilizado para reproducir sonido desde un dispositivo electrónico. También es llamado altoparlante, bocina, speaker, loudspeaker.

Los altavoces convierten las ondas eléctricas en energía mecánica y esta se convierte en energía acústica. Más técnicamente, es un transductor electroacústico que convierte una señal eléctrica en sonido. Grabador de sonido en el sistema operativo: Todos los sistemas operativos tienen un grabador de sonido. Caracteristicas de sonido digital.

7Frecuencia de muestreo. Calidad de sonido: También llamada tasa de muestreo, es la cantidad de muestras por unidad de tiempo. Cuanto mayor sea, mayor es la respuesta en frecuencia del sistema. El estándar para los discos compactos (CD) es de 44,1 kHz. La calidad del sonido depende de la frecuencia del muestreo y a la resolución.
Frecuencias de muestreo o de sampleo, se refiere al numero de mediciones que se hacen por segundo. Cuanto mayor sea el numero de muestras mejor es la calidad del sonido, por ejemplo si la velocidad de muestreo es de una cada un segundo las variaciones del sonido que se produzcan en el intermedio no serán registradas. Según estudios, la frecuencia de muestreo debe ser el doble del sonido mas alto que se pueda escuchar, como el oído humano puede escuchar aproximadamente hasta los 20.000 Hercios, la frecuencia optima de muestreo será de 44,1 Khz. (44.100 hercios), estaa frecuencia que se usa en los CD de música. Como los instrumentos o las voces humanas no pasan la frecuencia de los 10 Khz., con una frecuencia de muestreo de 32 Khz. es mas que suficiente, al bajar mucho la frecuencia de muestreo el sonido se vuelve opaco o poco nítido pues se pierden las frecuencias agudas.

8Canales: Canales de audio: En primer lugar debemos tener en cuenta que un parlante no es un canal de audio, podemos tener cuatro parlantes trabajando bajo el mismo canal de audio. Por ello si compramos una potencia o amplificador que dice que podes conectar cuatro parlantes no significa que tengamos cuatro canales, significa que por la relación de impedancia de los parlantes el amplificador es apto para esta conexión. Un amplificador que tiene mas de un canal significa que posee mas de un amplificador interno. Es decir si tenemos un amplificador de dos canales, tenemos internamente dos amplificadores separados, uno amplifica un canal y el otro el canal restante. Si un amplificador tiene "x" canales tiene que tener "x" entradas de audio. Por ejemplo un amplificador de cuatro canales tiene que tener cuatro entradas(cuatro RCA). Pero que es un canal de audio? Un canal de audio tiene relación con la grabación del mismo, si grabamos un sonido por la izquierda, lo tenemos que escuchar por la izquierda, si lo grabamos por la derecha, lo tenemos que escuchar por la derecha y así sucesivamente.

Un equipo como un "home" posee comúnmente 5.1 canales, significa que podemos escuchar el sonido por 5 lugares diferentes independientemente, siempre y cuando la grabación del audio posee 5 canales, sino estaremos desperdiciando el potencial del "home". Subcanales: Un subcanal significa que dado un determinado canal de audio a este solo se le reproducirá cierta gama de frecuencia del mismo. Comúnmente encontramos 2.1, 5.1, 7.1, etc. esto significa que tiene una determinada cantidad de canales y que tiene un subcanal. Comúnmente el subcanal es el "subwoofer", este reproduce por lo general los sonidos de baja frecuencia del canal frontal. Este subcanal lo genera el equipo mismo, a través de un filtro. Por ello a la hora de comprar un equipo debemos tener en cuenta cuantos canales tenemos para reproducir(si es por ejemplo un mp3 solo tenemos dos canales), cuantos queremos reproducir y si queremos alguna subdivisión como un subwoofer. O si tan solo queremos reproducir una subdivisión, por ejemplo si queremos aumentar solamente los graves de nuestro estéreo, tenemos que adquirir un equipo "mono"(un solo canal), con algún filtro para reproducir solamente los graves, de esta manera generaremos un equipo ".1" o sea con un subcanal. Canales . Número de pistas que forman un sonido.

  • Sonido mono : 1 pista.

  • Sonido estéreo : 2 pistas.

Sonido 5.1 : 5 pistas (Sonido envolvente 9Tamaño de la muestra: Tamaño de la muestra. Número de bits empleados para grabar. 16 bits para grabar con calidad CD audio. 8 bits para grabar con calidad emisora de radio.


  • Amplitud. Valor de la energía de un sonido (dB). Se puede regular con los mandos del volumen del aparato en la reproducción. Si el volumen es muy alto la grabación se deforma, si es muy baja se grabarán ruidos.

Ruidos. Son sonidos grabados de forma aleatoria y no deseados. Calculo del tamaño de un archivo de audio.


10Formula para calcular el tamaño de un archivo de audio sin comprimir.

Tamaño = FrecuenciaXCanalesXTamañodelamuestraXsegundosdeduración.

Formatos de audio.

11WAV: Es un formato de audio creado por Microsoft. Este formato es tan popular que se considera el formato de audio estandard. Archivos Wave se identifican por la extensión WAV (.wav). Usado originalmente en PCs, el formato Wave fue aceptado como un medio de intercambio por otras plataformas de ordenadores como Macintosh. Esto permite a los programadores tener libertad trabajando con archivos de audio modificandolos en diferentes plataformas.

El formato Wave almacena la información sobre el número de pistas (mono o estereo), frecuencia de muestreo, profundidad de bits, igualmnente que datos raw de audio no comprimidos. 12MIDI: Responde a las siglas de Musical Instrument Digital Interface, y apareció in 1983. No es realmente un formato de audio, sino que es un protocolo por el cual varios intrumentos musicales electrónicos, incluidos las tarjetas de sonido de los ordenadores, se pueden conectar y interactuar entre ellos para producir música. De todas formas, mucha gente utiliza la palabra "MIDI" para referirse a ficheros (secuencias) producidas por dispositivos MIDI. A diferencia del resto de formatos de audio, los archivos MIDI, no contienen música grabada, sino un conjunto de instrucciones que indican como tocar un tono. Los archivos MIDI son muy pequeños y, por lo tanto, excelentes para utilitzar en páginas Web y otras aplicaciones. Solo unos segundos de descarga, aun teniendo una pequeña velocidad de conexión, pueden significar muchos minutos para escuchar buena música. Los archivos MIDI se pueden reproducir en la mayoría de navegadores si tener que instalar ningún plugin. Además este tipo de archivo es mucho mas fácil de editar que cualquier otro tipo de archivo de m&uuacute;sica.

13CD-A: La música en formato CD tiene la extensión .CDA (Compact Disk Digital Audio), dicho sistema utiliza un formato no comprimido, de alta calidad, cada minuto de música en estéreo suele ocupar entre 8 a 10 Megabytes.

El formato .CDA es impensable colgarlo en la red, si una canción suele durar entre 3 a 5 minutos nos vamos casi a 50 Megabytes por canción y es mucha información por sólo una canción.

14MP3: Su nombre proviene de la abreviatura MPEG-Layer3 y es el formato más estandarizado para el intercambio de archivos musicales en Internet.

El nacimiento del formato MP3 es ofrecer contenidos multimedia de alta calidad y reducir el espacio sin alterar la calidad de audio.

La compresión del audio ha sido realizada de acuerdo al algoritmo de codificación desarrollado por MPEG (Moving Picture Expert Group) y el Instituto Tecnológico Fraunhofer , que se ha estandarizado como ISO MPEG Audio Layer3.

15WMA: WMA (Windows Media Audio) es la alternativa de Microsoft al formato MP3. El formato de compresión es diferente al MP3, el número de kilobits por segundo esté en una escala de calidad distinta. Un ejemplo es que una canción WMA codificada a 96 Kbps tiene casi la misma calidad que una de MP3 a 160 Kbps. Eso significa que el formato WMA es de menor tamaño que el formato MP3. Todo lo que suena a Microsoft va poco a poco haciéndose paso a nivel popular, pero tiene una pega, que si la canción está registrada con derechos de autor, no se pueden copiar.

Para la Industria Musical dicho formato el WMA es ideal para sus intereses económicos de ellos y de Microsoft, pero para los nuestros no.

16OGG VORBIS: Es un formato contenedor bitstream que ofrece alta eficiencia en el streaming y la compresión de archivos. Como la mayoría de formatos contenedores, Ogg encapsula datos comprimidos e incomprimidos permitiendo la interpolación de los datos de audio y vídeo dentro de un solo formato conveniente.

Ogg es un formato de archivo libre de patentes que incluye un número de códecs separados e independientes de vídeo y audio, ambos desarrollados en código abierto. La diferencia de .ogg y otros formatos contenedores consiste en que Ogg está orientado a stream. Eso significa que puede ser escrito y leído en un solo paso.

Debido al hecho de la licencia libre de Ogg, varios códecs de Ogg han sido incluidos en muchos reproductores multimedia tanto libres como comerciales.

Real Audio (RM): es un formato de audio creado por RealNetworks en 1995, la versión actual es Real Audio 10. Archivos de este formato tienen las extensiones RA, RAX, RM o RAM.

Real Audio a menudo se usa como un formato de audio streaming (el archivo puede ser descargado y reproducido al mismo tiempo gracias a su características de adaptarse rápidamente). Esta particularidad hizo el formato Real Audio muy popular entre las estaciones de radio en internet.

Archivos Real Audio pueden ser ejecutados con RealNetworks' RealPlayer. Para guardar stream de audio como un archivo se usa MPlayer and StreamBox VCR, ambos gratuitos. Hay quien usa Real Alternative o JetAudio para reproducer archives Real Audio, pero en este caso se requiere plugin adicional gratuito.

Programas para capturar, realizar efectos de sonido y ,mezcla de archivos.

Ashampoo SNAP 3 v3.01 – Programa de captura de imágenes y vídeo.

17 Renoise 2.6.0 : Renoise es una herramienta de creación de música que permite al usuario crear todo tipo de samples, loops y efectos sonoros con una calidad excelente.