Red de Respuestas Legales - Leyes y reglamentos - Formatos comunes para formatos de audio

Formatos comunes para formatos de audio

El formato MP3 nació en Alemania en los años 1980. El llamado MP3 también se refiere a la parte de audio del estándar MPEG, es decir, la capa de audio MPEG. Se divide en tres capas según la diferencia en la calidad de compresión y el procesamiento de codificación, correspondientes a tres tipos de archivos de sonido: * .mp1/* .mp2/* .mp3. Cabe señalar que la compresión de archivos de audio MPEG es una compresión con pérdida. La codificación de audio MPEG3 tiene una alta tasa de compresión de 10:1 ~ 12:1, mientras que básicamente mantiene la parte de audio baja sin distorsión, pero sacrifica la parte de audio alta de 12 KHz a 16 KHz en el archivo de sonido. Los archivos de música de la misma longitud se almacenan en formato *.mp3, que generalmente es sólo 1/10 de *. wav, por lo que la calidad del sonido no es tan buena como la del formato CD o WAV. Debido a que tiene un tamaño de archivo pequeño y buena calidad de sonido cuando apareció por primera vez, ningún otro formato de audio podía competir con él, proporcionando así buenas condiciones para el desarrollo del formato *.mp3. A día de hoy, este formato sigue siendo muy popular y su estatus como formato de audio convencional es difícil de superar. Sin embargo, el problema de los derechos de autor de la música MP3 no se ha resuelto porque el MP3 no tiene tecnología de protección de derechos de autor, es decir, cualquiera puede usarlo.

La música comprimida en MP3 tiene muchas frecuencias de muestreo. Una frecuencia de muestreo de 64 Kbps o menos puede ahorrar espacio, y un estándar de 320 Kbps también puede lograr una calidad de sonido extremadamente alta. Utilizando MusicMatch Jukebox 6.0 y el codificador MP3 equipado con Fraunhofer IIS Mpeg Lyaer3, se codificó una canción de 3 minutos a 128 Kbps para obtener un archivo MP3 de 2,82 MB. La tecnología predeterminada CBR (frecuencia de muestreo constante) puede muestrear una canción a una frecuencia fija, mientras que VBR (frecuencia de muestreo variable) puede aumentar la frecuencia de muestreo cuando la música está "ocupada" para obtener una mayor calidad de sonido, pero es posible que el archivo MP3 resultante no se reproduzca. en algunos jugadores. Configure el nivel de VBR básicamente a la misma calidad de sonido que el archivo CBR anterior y el archivo VBR MP3 resultante tendrá 2,9 MB.

A partir de 2008, MP3 es el formato de audio digital comprimido con pérdida con más usuarios. Su nombre completo es MPEG (Moving Picture Experts Group) Audio Layer-3. Cuando apareció por primera vez, su tecnología de codificación no era perfecta. Es más como un marco de estándares de codificación, que la gente debe mejorar. La antigua codificación de MP3 utilizaba una velocidad de bits fija (CBR). 128 Kbps significa codificar a una velocidad de datos fija de 128 Kbps; puede aumentar la velocidad de bits hasta 320 Kbps y la calidad del sonido será mejor. Naturalmente, el tamaño del archivo aumentará en consecuencia.

Dado que el método de codificación de MP3 es abierto, podemos elegir diferentes principios acústicos para la compresión basados ​​en este marco estándar, por lo que Xing Company pronto lanzó el método de compresión de velocidad de bits variable (). El principio es codificar las partes complejas de una canción con una velocidad de bits alta y las partes simples con una velocidad de bits baja. Sólo así podremos lograr aún más la unidad de calidad y cantidad. Por supuesto, el algoritmo VBR del primer codificador Xing era muy pobre y la calidad del sonido estaba lejos de CBR (velocidad de bits fija). Sin embargo, este algoritmo señala una dirección y otros desarrolladores también lanzaron sus propios algoritmos VBR, que continuaron mejorando el efecto. LAME actualmente es reconocido como el mejor. Implementa perfectamente el algoritmo VBR y es un software completamente gratuito. Un equipo de desarrollo compuesto por entusiastas lo ha estado desarrollando y mejorando continuamente.

LAME desarrolló el algoritmo ABR basado en VBR. ABR (AverageBitrate (ABR)) es un parámetro de interpolación de VBR que se creó en vista de la baja proporción de volumen de archivos de CBR y el tamaño de archivo incierto generado por VBR. Dentro del tamaño de archivo especificado, ABR cuenta cada 50 fotogramas (30 fotogramas). es aproximadamente 1 segundo) es un segmento, el flujo relativamente bajo se usa para baja frecuencia y frecuencia insensible, el flujo alto se usa para alta frecuencia y gran rendimiento dinámico, que puede usarse como un compromiso entre VBR y CBR

<. Poco después de su aparición, el MP3 creó un nuevo campo musical con su alta relación de compresión de 12:1 y su buena calidad de sonido. Sin embargo, la apertura del MP3 inevitablemente provocó disputas de derechos de autor en este contexto. ha surgido una mejor calidad de sonido y una protección de derechos de autor más efectiva. No existe una conexión necesaria entre MP3 y MP4. En primer lugar, MP3 es el estándar técnico internacional para la compresión de audio y MP4 es una marca registrada.

El formato WMA (Windows Media Audio) es un reproductor pesado de Microsoft. El fondo es resistente y la calidad del sonido es mejor que el formato MP3 y mucho mejor que el formato RA. Al igual que el formato VQF desarrollado por Yamaha Corporation de Japón, está diseñado para lograr tasas de compresión más altas que el MP3 al reducir el tráfico de datos pero manteniendo la calidad del sonido. Generalmente, la relación de compresión de WMA puede alcanzar aproximadamente 1:18. Otra ventaja de WMA es que los proveedores de contenido pueden agregar protección de derechos de autor a través de esquemas DRM (Gestión de derechos digitales), como Windows Media Rights Manager 7. Esta tecnología de protección de derechos de autor incorporada puede limitar el tiempo de reproducción y la cantidad de veces, incluso la máquina de reproducción, etc. , lo cual es una buena noticia para las compañías de música que se han visto afectadas por la piratería. Además, WMA también admite la tecnología de transmisión de audio, adecuada para la reproducción en línea en la red. Como pionero de Microsoft en aprovechar la música online, se puede decir que cuenta con tecnología avanzada y funciones potentes, y es más conveniente instalar un reproductor MP3 adicional. La perfecta combinación del sistema operativo Windows y Windows Media Player le permite reproducir música WMA directamente siempre que instale el sistema operativo Windows. La nueva versión de Windows Media Player 7.0 agrega la función de convertir directamente CD al formato de sonido WMA. En el nuevo sistema operativo Windows XP, WMA es el formato de codificación predeterminado. Todo el mundo sabe lo que pasó con Netscape y ahora el "lobo" está aquí de nuevo. WMA es un formato que le permite ajustar la calidad del sonido durante el proceso de grabación. En el mismo formato, la calidad del sonido es tan buena como la del CD y la tasa de compresión es lo suficientemente alta para la reproducción en red. Aunque ahora no es muy popular en Internet, ha sido reconocido y fuertemente apoyado por cada vez más sitios web bajo la promoción a gran escala de Microsoft. Es casi igual a *.mp3 en el campo de la música en línea, y lo es. También divide a Real en términos de reproducción en línea. Por tanto, casi todos los formatos de audio sienten la presión del formato WMA. Según la información publicada oficialmente por Microsoft, el formato WMA es extremadamente protector e incluso puede limitar la máquina de reproducción, el tiempo de reproducción y los tiempos de reproducción, y tiene capacidades considerables de protección de derechos de autor. Cabe decir que el lanzamiento de WMA tiene como objetivo abordar las deficiencias de la falta de restricciones de derechos de autor del MP3: los usuarios comunes pueden acoger con agrado este formato, pero como titulares de derechos de autor, las compañías discográficas prefieren la tecnología de compresión de música que es difícil de copiar, de la que se encarga WMA de Microsoft. estos registros.

Además de la protección de derechos de autor, WMA también profundiza la relación de compresión, con el objetivo de reducir el tamaño del archivo en las mismas condiciones de calidad de sonido (por supuesto, esto sólo es efectivo cuando la tasa de bits de MP3 es menor). de 192 KBPS. De hecho, cuando el algoritmo LAME comprime el formato MP3, generalmente refleja que la calidad del sonido de MP3 es mejor que la de WMA cuando es superior a 192 KBPS. RealAudio es principalmente adecuado para apreciar música en línea en Internet. Hoy en día, la mayoría de los usuarios todavía utilizan módems con una velocidad de 56 Kbps o inferior, por lo que la reproducción típica no ofrece la mejor calidad de sonido. Algunos sitios de descarga le pedirán que elija el mejor archivo auténtico según la velocidad de su módem. Existen varios formatos de archivos reales: RA (RealAudio), RM (RealMedia, RealAudio G2), RMX (RealAudio Secured), etc. La característica de estos formatos es que la calidad del sonido puede cambiar con diferentes anchos de banda de la red, lo que permite a los espectadores con un ancho de banda más rico obtener una mejor calidad de sonido y al mismo tiempo garantizar que la mayoría de las personas puedan escuchar un sonido fluido.

Recientemente, con la mejora general del ancho de banda de la red, Real Company está lanzando un formato para transmisión en red para lograr la calidad de sonido de CD. Si su software RealPlayer no puede soportar este formato, le recordará que descargue un paquete de actualización gratuito. Muchos sitios web de música ofrecen versiones de demostración de canciones en su formato auténtico. La última versión es RealPlayer 9.0. El número 39 de Computer News también presentó RealPlayer 9.0 en detalle, por lo que no entraré en detalles aquí. Otro formato de Yamaha Corporation es *. VQF, su núcleo es reducir el tráfico de datos manteniendo la calidad del sonido para lograr una mayor relación de compresión. La relación de compresión de audio de Vqf es casi el doble que la relación de compresión de audio MPEG estándar, que puede alcanzar aproximadamente 18:1 o incluso más.

En otras palabras, presionar una canción de 4 minutos (archivo WAV) en MP3 requiere aproximadamente 4 MB de espacio en el disco duro, mientras que la misma canción solo requiere aproximadamente 2 MB de espacio en el disco duro si se utiliza la tecnología de compresión de audio VQF. Por lo tanto, en términos de relación de compresión de audio, MP3 y RA no se oponen a VQF. En las mismas condiciones, el tamaño del archivo VQF comprimido es entre un 30% y un 50% más pequeño que el MP3, lo que facilita la comunicación en línea. La calidad del sonido es excelente, cercana a la del CD (estéreo de 16 bits y 44,1 kHz). Se puede decir que la tecnología también es muy avanzada, pero debido a la mala publicidad, este formato es difícil de utilizar. *.vqf se puede reproducir con el reproductor de Yamaha. Al mismo tiempo, Yamaha también proporciona software para la conversión de archivos *. archivos wav a *. archivo vqf. El documento carece de carácter y publicidad.

Cuando VQF comprime música a velocidades de muestreo de audio de 44 KHz y 80 kbit/s, su calidad de sonido es mejor que la de MP3 a 44 KHz y 128 kbit/s. Su calidad de sonido es casi equivalente a MP3 a 44 KHz y 256 kbit/s. Pocas personas pueden oír la diferencia entre los archivos de audio comprimidos de SoundVQ y los archivos de audio originales al escuchar el efecto de reproducción. Jugar VQF solo requiere una configuración de computadora Pentium 75 o superior. Por supuesto, VQF puede funcionar mejor si utiliza una máquina Pentium 100 o superior. De hecho, reproducir VQF sólo requiere entre un 5% y un 10% más de CPU que reproducir MP3.

La tecnología VQF o TwinVQ fue desarrollada por NTT y Yamaha, pero su software de aplicación es gratuito. Sólo NTT y Yamaha no han publicado el código fuente de VQF. OggVorbis es un nuevo formato de compresión de audio similar a los formatos de música existentes, como MP3. Pero una cosa es diferente: es completamente gratuito y abierto, sin restricciones de patentes. Vorbis es el nombre de este mecanismo de compresión de audio y Ogg es el nombre de un proyecto que pretende diseñar un sistema multimedia completamente abierto. Actualmente el proyecto sólo implementa OggVorbis.

La extensión del archivo OggVorbis es *.OGG. El formato de diseño de este archivo es muy avanzado. Este formato de archivo continúa mejorando el tamaño y la calidad del sonido sin afectar a los codificadores o reproductores más antiguos.

VORBIS utiliza compresión con pérdida, pero reduce la pérdida utilizando modelos acústicos más avanzados. Por lo tanto, OGG codificado con la misma tasa de bits suena mejor que MP3. Además, hay otra razón por la que el formato MP3 está protegido por patentes. Si desea publicar su trabajo en formato MP3, deberá pagar regalías a Fraunhofer (la empresa que inventó el MP3). VORBIS no tiene este problema en absoluto.

Para los fanáticos de la música, la ventaja obvia de usar archivos OGG es que pueden obtener una mejor calidad de sonido con archivos más pequeños. Y debido a que OGG es completamente abierto y gratuito, la producción de archivos OGG no estará sujeta a ninguna restricción de patentes y se espera obtener una gran cantidad de codificadores y reproductores. Por eso hay tan pocos codificadores de MP3 y la mayoría son software comerciales, porque Fraunhofer cobra regalías. Vorbis utiliza matemáticas completamente diferentes a las del MP3 y, por lo tanto, enfrenta diferentes desafíos al comprimir música. Los archivos Vorbis y MP3 codificados con la misma tasa de bits tienen la misma calidad de sonido. Vorbis tiene una anotación flexible y bien diseñada que evita operaciones complejas como el etiquetado ID3 de archivos MP3. Vorbis también incluye escalado de velocidad de bits: ajusta la velocidad de bits de un archivo sin volver a codificarlo. Los archivos Vorbis se pueden dividir en pequeños fragmentos y editar con granularidad de muestra; Vorbis admite múltiples canales, se pueden conectar lógicamente, etc. AMR, el nombre completo de Adaptive Multi-Rate, se utiliza principalmente para audio en dispositivos móviles. La relación de compresión es relativamente alta, pero la calidad es pobre en comparación con otros formatos de compresión. Debido a que se usa principalmente para voz y llamadas, el efecto sigue siendo muy bueno.

1. Clasificación

1.AMR: También conocido como AMR-NB, en comparación con el WB a continuación, el rango de ancho de banda de voz es de 300 a 3400 Hz y el muestreo es de 8 KHz.

2.AMR-WB: banda ancha AMR,

Rango de ancho de banda de voz: 50-50-7000Hz muestreo de kilohercios de 16KHz.

"AMR-WB" se denomina "Adaptive Multi-rate-Wideband", es decir, "Adaptive Multi-rate Wideband Coding" y su frecuencia de muestreo es de 16 kHz. Es un estándar de codificación de voz de banda ancha adoptado por ITU-T y 3GPP, también conocido como estándar G722.2. AMR-WB proporciona un ancho de banda de voz de 50 Hz a 7000 Hz. Los usuarios pueden sentir subjetivamente que la voz es más natural, cómoda y fácil de distinguir que antes.

Por el contrario, la frecuencia de muestreo EFR (Enhanced Full Rate) utilizada por GSM es de 8 kHz y el ancho de banda de voz es de 200 ~ 3400 Hz.

La ventaja de aplicar AMR-WB a GSM de banda estrecha (canal de velocidad completa 16k, GMSK) es que puede utilizar tres codificaciones: 6,6 kb/s, 8,85 kb/s y 12,65 kb/s. la red está ocupada, C/I se deteriora, el codificador puede ajustar automáticamente el método de codificación para mejorar la QoS. En esta aplicación, AMR-WB tiene mejor inmunidad al ruido que AMR-NB.

La aplicación de AMR-WB en EDGE y 3G puede demostrar plenamente sus ventajas. Un ancho de banda de transmisión suficiente garantiza que AMR-WB pueda utilizar nueve codificaciones desde 6,6 kb/s hasta 23,85 KB/s**, y que la calidad de voz supere la de los teléfonos fijos PSTN.