Cómo generar y agregar ruido blanco gaussiano en el procesamiento de señales de vozLa tecnología digital tiene un profundo impacto en el mundo casi digital de hoy. Se sabe que la tecnología de audio digital se utiliza ampliamente. Las tecnologías digitales como CD y VCD ya han entrado en la radiodifusión digital en miles de hogares y han desarrollado gradualmente algunos productos y aplicaciones que están estrechamente relacionados con los consumidores de todo el mundo. Los temas que presentará este artículo son: el surgimiento y desarrollo de la tecnología de compresión de audio digital y las aplicaciones actuales y tempranas de la tecnología de compresión de audio. La tecnología de compresión de audio se refiere a una tecnología que utiliza tecnología de procesamiento de señales digitales para perder información o ignorar las condiciones de pérdida (compresión) en el flujo de señal de audio digital original (modulación de código de pulso). Su codificación de compresión de tasa de código debe tener una transformación inversa correspondiente. La decodificación o decodificación de señales de audio puede introducir los beneficios del ruido cuantificado y la distorsión fija en las señales digitales. Obviamente, sus correspondientes desventajas son el aumento de los requisitos de capacidad de almacenamiento y el aumento de los requisitos de capacidad del canal de transmisión. Como por ejemplo CD. La frecuencia de muestreo es 44. La precisión de cuantificación de un kilohercio es de un bit logarítmico y una señal de audio estéreo de reloj requiere aproximadamente 10 millones de bytes de capacidad de almacenamiento. Se dice que la capacidad de un tocadiscos de CD es aproximadamente un ancho de banda alto, y el problema es aún más grave en el campo del vídeo digital. Se considera que todos los bits son necesarios. Se descubrió que el flujo de código PCM se utiliza directamente para el almacenamiento y la transmisión. El sonido se comprime al menos cuatro a uno, lo que significa que se retiene el 25% del contenido digital, la relación de compresión es incluso de cientos. veces. Se presta amplia atención a la investigación y aplicación de la tecnología de compresión de audio. La investigación y el desarrollo de larga data de codificación de ley A y ley U, compansores cuasi instantáneos simples y aplicaciones de transmisión de sonido y señales de voz RDSI han sido bien desarrollados y ampliamente utilizados, como PCM diferencial adaptativo (ADPCM), la aplicación de tecnologías como la codificación predictiva lineal (LPC) en el campo de la transmisión y sistemas como NICAM (multiplexación de audio con compresión casi instantánea) utilizan tecnología de compresión de audio II. La compresión de audio es la categoría principal y representante típico. En términos generales, las técnicas de compresión de audio incluyen compresión con pérdida y compresión con pérdida. Según la situación de la compresión, se divide en diferentes tecnologías de compresión, como compresión de dominio, compresión de transformación, compresión de banda y compresión híbrida. Su complejidad (incluida la complejidad entre cuadros y la complejidad espacial), la calidad del audio, la eficiencia computacional (es decir, la relación de compresión) y el retraso del códec son los mismos que los de varias aplicaciones de tecnología de compresión. (1) La compresión de dominio (o codificación de forma de onda) se refiere al procesamiento directo de valores de flujo de código PCM de audio y la compresión del flujo de código mediante detección de silencio, cuantificación no lineal, diferencial y otros medios. * * * Técnicas de compresión con menor complejidad computacional y menor calidad de sonido (calidad de sonido de CD >: 400 kbps) Las técnicas de compresión con retardo de códec (técnica de fase a fase) se utilizan generalmente para la compresión de voz en aplicaciones de baja tasa de bits (ancho de banda de señal de origen). Las tecnologías de compresión de dominio incluyen principalmente G. Paint One One, ADPCM, LPC, CELP y otras tecnologías desarrolladas por el compandor NICAM, incluida la tecnología ADPCM (SB-ADPCM) G. Paint Two One, G. Paint Two Two, Apt-X, etc. (2) Base teórica de la codificación de bandas con tecnología de compresión. La idea básica de la teoría de la codificación de bandas siempre ha sido que Crochiere es igual a 1-9. Se resuelve la señal en varias bandas de frecuencia y cada banda de frecuencia adopta la misma estrategia de compresión para reducir la tasa de código de acuerdo con sus mismas características de distribución. La introducción técnica de la tecnología de compresión de banda de frecuencia se basa en el análisis espectral de la señal de comunicación del modelo de conocimiento de la señal de sonido (modelo de teoría del sonido) para determinar el orden de cuantificación del valor de la banda de frecuencia o el valor del dominio de frecuencia, y la selección de parámetros es perceptiva. . ) Codificación de compresión Las dos tecnologías de compresión en el dominio de fase de compresión son más complejas. La misma eficiencia de codificación y calidad del sonido aumentan, y el retraso de codificación también aumenta en consecuencia. En términos generales, la complejidad de la codificación de banda es ligeramente menor que la de la codificación por transformación y el retraso es más corto. Dado que la tecnología de compresión de banda utiliza principalmente señales modelo de enmascaramiento de sonido para la compresión, se introduce ruido de cuantificación, parte del ruido se decodifica de acuerdo con la curva de enmascaramiento auditivo y la señal de sonido se usa para enmascarar el oído humano. Debido a que el análisis de bandas de frecuencia utiliza ruido dentro de cada banda de frecuencia para limitar la señal de la banda de frecuencia, afecta el orden de cuantificación de cada banda de frecuencia. La eficiencia de la compresión es la misma que la técnica de coincidencia de bits de estado. La tecnología de condición de velocidad de bits original logra una calidad de sonido completamente transparente (estándar de calidad de sonido EBU). Actualmente, la tecnología de compresión de bandas se utiliza ampliamente en el almacenamiento y producción de programas de sonido digital. Los representantes típicos de la radiodifusión digital son los famosos MPEG-1 capa I, capa II (Musicam) y sus aplicaciones en Philips DCC PASC (Codificación de subbanda adaptativa de precisión), etc.
(3) La tecnología de compresión de transformación y la tecnología de compresión de banda de frecuencia están en el mismo segmento técnico. Los parámetros del dominio de transformación obtenidos mediante transformación lineal se cuantifican y la señal de transmisión se descompone en varias bandas de frecuencia utilizando la transformada DFT y DCT (transformada de coseno discreto). MDCT et al. realizaron una asignación de bits de estado razonable basada en los parámetros del dominio de transformación del espectro de potencia corto de la señal, lo que mejoró significativamente la calidad del audio. Con el costo correspondiente, la complejidad computacional aumenta y la compresión del dominio de transformación tiene defectos como efectos de límite de bloque, respuesta previa y degradación severa de la calidad del sonido de baja tasa de bits. Con el avance de la tecnología, algunos defectos se eliminan gradualmente y se adoptan nuevas tecnologías de codificación por compresión. Algunas tecnologías representativas de codificación por compresión transformada, como DolbyAC-II, AT&Taspec (Audio Spectrum Perceptual Coding), PAC (Perceptual Audio Coder), etc. Estandarización de la tecnología de compresión de audio MPEG-1. Debido a que la tecnología de compresión de audio digital tiene una amplia gama de aplicaciones y buenas perspectivas de mercado, algunas instituciones de investigación y empresas de renombre no han escatimado esfuerzos para producir productos patentados. La estandarización de la tecnología de compresión de audio es muy importante. Se ha completado el trabajo de estandarización de la compresión de señales de voz del CCITT (ahora ITU-T). Estándares como G. Paint one, G. Paint two y G. Paint two bars, y la estandarización de la compresión de audio son reconocidos gradualmente por la industria. Audio MPEG-1 (ISO/IEC 111 pintura dos-tres) La compresión de audio MPEG-1 especifica tres modos, a saber, la primera capa, la segunda capa (llamada MP II por MUSICAM) y la tercera capa (llamada MP III). Desde la formulación de técnicas de compresión permitidas por estándares, se utilizan ampliamente tres modos de implementación (complejidad). VCD utiliza el caso de compresión de audio MPEG. Por su excelente calidad de sonido y adecuada complejidad, MUSICAM es ampliamente utilizado en la producción, intercambio, almacenamiento y transmisión de programas digitales, como estudios digitales, DAB y DVB. MP 3 combina las ventajas de MUSICAMASPEC y presenta las condiciones técnicas de la tecnología de compresión híbrida. La complejidad de MP 3 es significativamente mejor que la codificación alta. Debido a la baja velocidad de bits del MP3 y al alto nivel de calidad del sonido, la descompresión suave y la transmisión por Internet de China Pet Talk incluso influyeron en la formulación del estándar de audio MPEG-1. Hablemos primero del sistema estándar de audio MPEG-2 MPEG-4.