CINE
Formatos de audio digital



Formatos, soportes y sistemas de tratamiento digital:
CD-R: Recordable Compact Disc, Disco Compacto Grabable, disco compacto virgen que no admite reescritura.
CD-RW: Rewrittable Compact Disc, Disco Compacto Regrabable, disco compacto virgen que admite reescritura.
HDCD: High-Definition Compatible Digital, proceso de codificación de audio desarrollado por la compañía Pacific Microsonics para la mejora de los CDs de audio estándar. Su implantación se ha visto truncada por la introducción de los nuevos formatos de audio, el SACD y el DVD Audio.
SACD: Super Audio Compact Disc, un formato de audio de alta definición en soporte CD promovido por Sony.
DVD Audio: Formato de audio de Alta Definición en soporte DVD que trabaja con una resolución de 24 bits y una frecuencia de muestreo de 192 kHz, muy por encima de los 16 bits/44 kHz del CD Audio.
VCD: Video Compact Disc, formato de vídeo en soporte CD de prestaciones y calidad muy inferiores a los del DVD, pero de extensa implantación en el mercado asiático y en el terreno de la piratería

Dolby Digital (DD): Sistema de tratamiento digital de las señales de audio desarrollado por los laboratorios Dolby y empleado por primera vez en las salas durante el estreno de la película Batman vuelve (1992). Su capacidad multicanal le permite reproducir pistas de audio que pueden contener desde un canal (monofónico) hasta cinco canales mas un canal específico de subgraves.
DTS: Sistema de tratamiento digital de las señales de audio desarrollado por la compañía Digital Theater Systems y empleado por primera vez en las salas en el estreno de la película Parque Jurásico (1993). Su capacidad multicanal le permite reproducir pistas de audio que pueden contener desde un canal (monofónico) hasta cinco canales mas un canal específico de sungraves. Emplea un grado de compresión de la información menor que el del Dolby Digital, lo que redunda en un enriquecimiento de la gama dinámica.

Formatos audio digital en la red:

  • WAV: Los archivos de forma de onda (o simplemente wave) son los formatos de sonido más comunes en las plataformas Windows. Los archivos WAV también pueden reproducirse en Mac y en otros sistemas con software reproductor.
  • MPEG(MP3): El formato Motion Pictures Experts Group (MPEG) es un formato estándar con una capacidad de compresión importante. Los archivos MPEG de nivel 3 o MP3 son utilizados frecuentemente para distribución de música por la web. Sin embargo, debido a su tamaño, los archivos MPEG hay que descargarlos completamente antes de reproducirlos.
  • RealAudio (.rm): Real Audio es la tecnología que predomina actualmente en la Web. Necesita un reproductor propietario, pero las versiones básicas del reproductor están disponibles gratuitamente.
  • MIDI: El formato Musical Instrument Digital Interface no es un formato de audio digital. Representa notas y otra información para que pueda sintetizarse la música. El MIDI tiene un buen soporte y sus archivos son muy pequeños, pero solamente es útil para ciertas aplicaciones a causa de la calidad de su sonido cuando se reproduce en el hardware PC.
  • AU: El formato u-law es uno de los formatos de sonido más antiguos de Internet. Hay disponibles reproductores para casi todas las plataformas.
  • RMF: El Rich Music Format soportado por Beatnik (www.beatnik.com) es un formato de audio de alta calidad, fundamentalmente para "descarga-y-reproduce", que cada vez es más popular.
  • AIFF: El formato Audio Interchange File Format es muy común en los Mac. Se utiliza ampliamente en las aplicaciones multimedia, pero no es muy común en la Web.
  • Flac: Free Lossless Audio Codec (FLAC) (Códec de compresión de audio sin pérdida) Formato del proyecto Ogg sin pérdida. El archivo inicial puede ser recompuesto totalmente con la desventaja de que el archivo ocupe mucho más espacio del que se obtendría al aplicar compresión con pérdida o Lossy.

MPEG-1 Layer 3 (MP3), Windows Media Audio (WMA) (excepto WMA Lossless), Advanced Audio Coding (AAC), (Ogg Vorbis), Adaptive Transform Acoustic Coding ATRAC, ADPCM, etc., al comprimir el archivo pierden, de forma irreversible, parte de la información del original, a cambio de un gran ahorro de tamaño en el archivo. FLAC no ahorra tanto tamaño de archivo, rara vez baja de dejar el archivo en un tercio del tamaño original, ya que no elimina nada de la información contenida en el original. Como norma se reduce entre la mitad hasta tres cuartos según el tipo de sonido procesado.

Audio digital en la red:
El sonido digital se mide por la frecuencia de muestreo, o cuántas veces es digitalizado el sonido durante un determinado período de tiempo. Las frecuencias de muestreo se indican en kilohercios (kHz), que indican el número de veces que se muestrea el sonido por segundo. La calidad de sonido CD se obtiene con 44,1 kHz, o 44.100 muestras por segundo. Para el sonido estéreo, se necesitan dos canales, cada uno de 8 bits; a 16 bits por muestra, esto da lugar a 705.600 bits de datos de un CD, produciendo un sonido de alta calidad, a demanda del usuario final. En realidad, la transmisión de esta cantidad de datos ocuparía casi la mitad del ancho de banda de la red T1. Como el usuario medio de la Web no dispone de este ancho de banda, es necesaria otra solución. Una posible solución es disminuir la frecuencia de muestreo cuando se crea el sonido digital para su envío a través de la Web. Una frecuencia de muestreo de 8 kHz, en mono, produciría, para aplicaciones sencillas, tales como lenguaje, unos resultados aceptables, especialmente si consideramos que el hardware de reproducción consiste generalmente en una combinación de una sencilla tarjeta de sonido y un pequeño altavoz. Un audio de baja calidad no requiere más de 64.000 bits de datos por segundo, pero el usuario final aún tiene que esperar a descargar el sonido. Los usuarios modernos necesitan varios segundos para recibir, incluso en las mejores condiciones, un solo segundo de sonido de baja calidad, haciendo imposible el sonido continuo.


Jérôme Rota El formato de vídeo DivX:
Aunque el tráfico internacional de mercancías falsificadas sigue creciendo cada año, y la relajación legal de una parte de Europa del Este en materia de protección de a propiedad intelectual ha hecho que países como Ucrania o la República Checa se codeen con sus veteranos colegas asiáticos (China, Taiwan, Corea del Norte, Filipinas...) en el terreno de la piratería del DVD, posiblemente lo que más temen ahora los poderoso estudios de Hollywood es el DivX, bautizado con el nombre de un fallido DVD de alquiler. Es un standard de compresión basado en el MPEG-4 que permite reducir los 4,7 Gb contenidos en un DVD-5 (una cara, una capa) a 650 Mb, la capacidad de un CD ordinario; un tamaño aún considerable, pero susceptible de convertir al DivX en el equivalente audiovisual del mp3 en conexiones de Internet de alta velocidad. La dimensión del problema se magnifica, no se trata ya de piratería extendida pero dispersa, en manos de unos cuantos hackers, sino que alrededor de DivX han surgido auténticas empresas, constituidas legalmente, y cuyos intereses entran en conflicto con los de la MPAA. Es el caso de DivX Networks, cofundada por el francés Jérôme Gej Rota, creador del formato, el ingeniero Joe Bezdek, y el que fuera vicepresidente de MP3.com Jordan Greenhall. DivX Networks no sólo ha convertido el DivX en ubicuo al hacer de dominio público su código interno, sino que, sobre la base de un nuevo DivX mejorado, el DivX-Deux, pretende adelantarse a los planes de los grandes estudios poniendo en marcha el llamado Proyecto Mayo, un servicio de vídeo a la carta descargable a través de Internet. Aunque la MPAA tiemble ante la perspectiva, lo cierto es que no le queda mucha más alternativa que pactar con DivX Networks un acuerdo que respete la propiedad intelectual y que le reporte su parte del pastel del nuevo y suculento negocio del videoclub virtual.

Xvid:
Basado en el estándar MPEG-4 ASP. (antes "XviD") Desarrollado como un proyecto de software libre por programadores voluntarios, después de que el proyecto OpenDivX fuera cerrado en julio de 2001. Creado como una alternativa libre a otros códecs sujetos al pago de derechos. Su calidad y eficiencia lo han convertido en uno de los códecs más populares, soportado de forma general en reproductores de DVD. Consigue comprimir una película completa con una calidad cercana a la de la fuente original de un tamaño de sólo 700 MB. Logra reducir el tiempo su compresión del MPEG-2 gracias a su algoritmo más avanzado. El vídeo usualmente se combina con audio MP3, o AC3 para tener audio y vídeo de alta calidad. Estos factores y el hecho de que el códec se distribuya de forma libre han contribuido a su gran éxito. Utiliza B-frames, o fotogramas bidireccionales, que almacenan entre dos fotogramas, uno anterior y otro posterior, su compresión suele ser superior a los cuadros llave (keyframes) y p-frames. Quarter pixel (Q-pel), se trabaja con una precisión doble en los vectores de movimiento de los bloques en la compensación del movimiento, es más útil en resoluciones bajas. Global motion compensation (GMC) o compensación global de movimiento, que entra en juego en giros de cámara y zoom, consiste en almacenar los vectores de movimiento de forma global (en relación a unos pocos) y consiguiendo hacer que muchos valgan 0, reduciendo su tamaño. Entrelazado, ideal para imágenes entrelazadas como la televisión, ya que mejora mucho la compresión y el resultado final en estos casos, ya que si se comprime una señal entrelazada como si no lo fuera, las líneas horizontales adyacentes, serán muy diferentes en escenas de movimiento, reduciendo la redundancia espacial, que es uno de los pilares de la compresión de video. Cuantización adaptativa, es una innovación psicovisual de Xvid, en ella se emplean diferentes matrices de cuantización por cada macrobloque, comprimiendo más fuerte aquéllos que son muy claros o muy oscuros, ya que son menos notables por el ojo que en los de tonalidad media. Pueden usarse matrices de cuantización MPEG, H.263 y también personalizadas. MPEG, ofrece imágenes más nítidas, con gran detalle, ideal para altas tasas de bits (por ejemplo en ripeos a 2 CDs). H.263 ofrece imágenes más suavizadas, permite disimular la formación de bloques cuando se necesita usar bajas tasas de bits, esto también se traduce en una imagen más borrosa y de menor detalle. Las matrices personalizadas permiten adaptarlo a elección del usuario, pero sólo son recomendables para usuarios avanzados.

El vídeo guardado como sale de la grabadora, está formado por 24 ficheros de imagen por segundo, alcanzando un tamaño considerableq. De los múltiples formatos de compresión destacan claramente el mpeg2 y el mpeg4. El primero lo utilizan en los DVD y los SVCD. El segundo son los populares Divx, Xvid, Nero, h264. Para visualizarlo el sistema operativo debe disponer del decodificador adecuado, que va "traduciendo" en lenguaje entendible por dicho sistema operativo el "idioma" en que está escrito. Por "idioma" se entiende el código empleado en su codificación (Divx, Xvid, nero .....) y por "traducir" se entiende lo que hace el decodificador (códec).

Formatos contenedores (AVI, MKV, OGM):
El fichero comprimido puede guardarse en varios formatos contenedores: AVI, MKV, OGM, ... La diferencia entre uno y otro viene dada por la forma en que los datos son guardados, y define cómo el sistema operativo debe acceder a ellos. Para dicho acceso son necesarios los filtros, que el sistema operativo (o el reproductor) emplea para reproducir dicho fichero. El más utilizado es el AVI, reconocido por Windows sin necesidad de filtros. Una película en formato Divx puede estar grabada en un fichero AVI, en un fichero MKV o un fichero OGM. Igualmente, puedes tener un AVI comprimido en Divx, en Xvid o en Nero. Una cosa es el formato contenedor y otra el formato de compresión.

Sistema de reescritura del CD-RW:
Lanzado por Philips en 1997. La grabación de la información se efectúa mediante un procedimiento de cambio de fase. La reproducción depende sólo de la intensidad del haz de luz reflejada desde la superficie del disco. Se pueden emplear las mismas cabezas ópticas de los lectores convencionales. Los bits se almacenan físicamente en la superficie de un disco virgen, alterando, mediante un haz láser, la fase original de una aleación de estado cristalino a un estado desordenado y amorfo, mucho menos reflectante. En modo lectura, la porción del haz reflejado difiere según el láser encuentre un punto cristalino o amorfo (70 y 30% son los valores comúnmente adoptados por el CD-ROM clásico). Un diodo transcribe estas señales de reflexión en una secuencia de 0 y 1. El proceso es reversible. El estado amorfo puede volver al estado cristalino inicial si la temperatura, en el punto de impacto de láser, es inferior al punto de fusión de la aleación.

El paso al sonido digital:
Técnico de oído legendario con mucha experiencia en remasterización. No puede escuchar una grabación sin pensar en los detalles técnicos. El famoso estudio que construyó en Englewood Cliffs se basa ahora en un moderno equipo digital. El elepé ya ha desaparecido, y en todo a lo que a mí se refiere, estoy contento... aparte de cualquier sentimiento personal por el producto acabado, ese proceso nunca fue algo realmente cómodo. A fin de cuentas, esa tecnología resultaba primitiva. (Rudy Van Gelder)


[ Indice | Menú Cine ]