¿Quién sabe todo lo que hay que saber sobre música?
La intensidad del sonido es el volumen que las personas sienten cuando lo escuchan, que es lo que solemos llamar la fuerza del sonido, grande o pequeño, pesado o ligero. Es uno de los criterios de evaluación subjetiva del oído humano para la estabilidad y debilidad del sonido. Su escala de evaluación objetiva, es decir, la medida de cantidades físicas, es la amplitud de la onda sonora. La intensidad y amplitud del sonido no son exactamente consistentes ni proporcionales, existiendo grandes diferencias en las bandas de baja frecuencia del rango de audio y diferencias considerables en las bandas de alta frecuencia.
El rango de audio, que es la frecuencia normal de las vibraciones sonoras que los humanos pueden escuchar, es de 20 Hz a 20 kHz. Por debajo de 20 Hz se llama infrasonido y por encima de 20 kHz se llama ultrasónico. En el rango de frecuencia de audio, el oído humano es más sensible a los sonidos en el rango de frecuencia media de 1 ~ 3 kHz, pero es relativamente lento para los sonidos en los rangos de frecuencia alta y baja, especialmente el rango de frecuencia baja. Hay otra característica del oído humano. Para sonidos muy fuertes, parece que el volumen tiene poca relación con la frecuencia, o que las amplitudes de los sonidos en varias frecuencias son similares. Pero para señales de bajo nivel (es decir, sonidos muy ligeros), parece que su volumen tiene una gran relación con la frecuencia: para sonidos de la misma amplitud, los sonidos en la banda de baja frecuencia y en la banda de alta frecuencia suenan más ligeros que los sonidos. en la banda de frecuencia media. Cuanto menor es la amplitud del sonido, más grave es el fenómeno de la cría de pollos. Para una señal de sonido de 1 kHz, la presión sonora más baja que el oído humano puede sentir es 2X10 (menos 4ª potencia) microbar. El microbar es una unidad de presión sonora, que equivale a 1 dina de presión en un área de 1 centímetro cuadrado. Los trabajadores electroacústicos llaman a esta presión sonora un nivel de presión sonora de 0 dB, generalmente escrito como 0 dB SPL (SPL es la abreviatura de nivel de presión sonora), que se considera 0. En un circuito de 600 ohmios, 775 voltios se establecen en 0 dB. Obviamente, es beneficioso expresar la amplitud del sonido en términos de "nivel de presión sonora" logarítmico en lugar de presión sonora. Esto se debe a que el rango de presión sonora que la gente puede escuchar es muy amplio, desde minibús 2X10 (cuarta potencia negativa) hasta minibús 2X10 (cuarta potencia negativa), una diferencia de 10 millones (1C) de veces. Un cambio de tan gran escala es incómodo de calcular y es mucho más conveniente expresarlo en términos de nivel de presión sonora que de presión sonora. Además, dado que la percepción del volumen por parte del oído humano no es lineal, las mediciones logarítmicas se acercan más a las características subjetivas del oído humano. Cuando el nivel de presión sonora alcanza los 1,20 decibelios SPL, el oído humano sentirá un dolor insoportable. Entonces, cuando la gente escucha a una banda en una sala de conciertos, ¿el rango dinámico natural de la música es de 0 a 1,20 dB SPL? Para música sinfónica grande, la sección de música más alta puede alcanzar 115 dB SPL y la sección de música más débil es de aproximadamente 25 dB SPL, por lo que el rango dinámico puede alcanzar 90 dB. Por supuesto, este es un caso raro. Por lo general, el rango dinámico de una sinfonía es de unos 50 a 80 decibeles, el rango dinámico de una canción de tamaño mediano es de unos 40 decibeles y el rango dinámico de un idioma es de unos 30 decibeles.
Por lo tanto, se requiere que los equipos de reproducción domésticos reproduzcan tanto como sea posible:
1] El rango dinámico del nivel de sonido natural de la música o el lenguaje mencionados anteriormente.
2) El nivel de presión sonora natural de la música o del lenguaje. Para los volúmenes de reproducción comúnmente utilizados en los hogares, el nivel de presión sonora promedio es de aproximadamente 86 dB SPL para música y aproximadamente 70 dB SPL para voz.
2. El tono, o tono, es la escala de evaluación subjetiva que realiza el oído humano del tono de un sonido. Su escala de evaluación objetiva es la frecuencia de las ondas sonoras. A diferencia de la relación entre intensidad y amplitud del sonido, el tono y la frecuencia son básicamente iguales. Cuando las frecuencias de las dos señales de sonido difieren dos veces, es decir, f2 = 2f1, se dice que f2 es una octava más alta que f1. La diferencia musical entre 1(do) y yo es solo una octava, que también se llama octava en musicología. Hay 12 semitonos en una octava. Tomando como ejemplo el área de 1-I octava, los 12 semitonos son: 1-#1, #1-2, 2-#2, #2-3, 3-4, 4-#4, #-5. Tenga en cuenta que la división de estas 12 escalas se basa básicamente en una relación logarítmica.
Cuando diferentes instrumentos musicales tocan notas de la misma frecuencia, las personas sienten que sus tonos son los mismos y que los sonidos que se tocan aquí tienen la misma frecuencia fundamental. Sin embargo, cada vez que un instrumento musical emite un sonido, este sonido no sólo tiene la frecuencia fundamental fo, sino que también tiene armónicos que son múltiplos enteros positivos de fo. Como se mencionó anteriormente, el tono de cada nota está determinado por fo, y los diferentes componentes armónicos de cada instrumento determinan el timbre único del instrumento. Entonces, ¿cuál es el rango de frecuencia fundamental natural de la música? Entre los instrumentos musicales, el piano tiene la gama más amplia de cuerdas fundamentales, desde 27,5 hasta 4136 Hz. El rango de tono de la música orquestal y sinfónica es de 30 ~ 6000 Hz. El rango de sonido de los instrumentos musicales nacionales chinos es de 50 ~ 4500 Hz.
Por cierto, la investigación electroacústica moderna muestra que el rango de frecuencia natural de los sonidos musicales excede el rango de las cadenas de audio audibles de 20 a 20 000 Hz. Por ejemplo, el tono de algunos tambores africanos está en la banda infrasónica, mientras que los armónicos (armónicos) de algunos instrumentos de viento de madera chinos pueden alcanzar los 25 kHz. Las señales de infrasonidos son inaudibles para el oído humano, pero pueden detectarse a través de la piel humana. Además, la frecuencia fundamental de la pintura del lenguaje está en el rango de 150 ~ 3500 Hz.
3. Timbre
Las personas no sólo tienen diferencias obvias en el volumen y el tono, sino que también pueden juzgar con precisión el "tono" de los sonidos. Aunque las notas tocadas por el clarinete y la trompa tienen el mismo tono (frecuencia fundamental), las personas pueden distinguir claramente cuál es el clarinete y cuál es la trompa sin confusión. Esto se debe a que sus timbres y envolventes de forma de onda son diferentes. El timbre está determinado por el espectro de armónicos de la música, que también se puede decir que está determinado por la forma de onda de la música. Porque la forma de onda de la música (que se puede ver en un osciloscopio electrónico) no es una onda sinusoidal simple, sino una onda compleja. El análisis muestra que esta forma de onda compleja se puede descomponer en una serie de ondas sinusoidales, incluida la frecuencia fundamental f0 y armónicos que son múltiplos enteros de f0: f1, f2, f3, f4, y sus amplitudes tienen proporciones específicas. Esta proporción le da a cada instrumento un "color" único: su timbre. Sin componentes armónicos, una simple señal sinusoidal no sería musical. Por lo tanto, el rango de frecuencia de la música instrumental no es sólo el rango de frecuencia de la frecuencia fundamental. Se deben incluir todos los armónicos del instrumento. Incluso los armónicos muy altos tienen un gran impacto en el timbre del instrumento. Los sistemas de reproducción de sonido de alta fidelidad deben prestar gran atención a permitir que se reproduzcan todos los armónicos, lo que da como resultado un rango de frecuencia de reproducción de al menos 15.000 Hz y un rango de frecuencia requerido de 20 kHz o superior. Además, los matices del idioma pueden alcanzar los 7 ~ 8 khz.
4. Envolvente de forma de onda
La envolvente de forma de onda de un tono musical se refiere a la amplitud de un solo tono musical al principio y al final cuando se toca cada nota (tocada, soplada, tirada). , arrancado). Los transitorios son la envolvente de una forma de onda. Algunos instrumentos musicales, al tocar, soplar, tirar o puntear, alcanzan inmediatamente la amplitud máxima, y luego la amplitud disminuye gradualmente, mientras que otros instrumentos son lo contrario, no muy emocionantes al principio, luego aumentan gradualmente y luego disminuyen gradualmente. Los cambios en estas envolventes de forma de onda también afectan el timbre del instrumento. Obviamente, el equipo de reproducción también requiere buenas capacidades de seguimiento de transitorios, de lo contrario provocará distorsión de la envolvente natural de la música.
Música moderna: dos mil años de exploración teórica y el nacimiento de doce temperamentos iguales
En la herencia de la teoría musical tradicional china, existe una ciencia que se ha explorado desde el siglo VII. siglo a.C. Duró más de 2.600 años y continúa hasta el día de hoy. Alguna vez los círculos académicos lo llamaron "conocimiento único".
El ritmo es la ciencia que estudia la relación lógica matemática entre el sistema tonal y el sistema musical. La acústica musical (acústica), las matemáticas y la musicología se compenetran entre sí y son una materia interdisciplinaria. En el estudio y aplicación de los sistemas de tono, el temperamento está casi en todas partes. Por ejemplo: la estructura y entonación de los tonos de la melodía; el principio de armonía y la teoría de la armonía en patrones: varias relaciones de intervalo en la combinación vertical de múltiples voces; la determinación del tono y el fonema en la fabricación y afinación de instrumentos; duetos y coros La afinación en un conjunto está directamente relacionada con el temperamento. Por lo tanto, en las "Veinticuatro Historias", además de "Le", cada dinastía también tiene capítulos como "Dharma", "Libro del Dharma" y "Calendario del Dharma".
Se puede imaginar el rico legado del "legalismo" y su posición en la historia de la cultura y los académicos chinos.
En la historia de la ley musical china, se produjo por primera vez una teoría jurídica completa, llamada "ley de pérdidas y ganancias de los tres puntos", que apareció a mediados del milenio. "Guanyuan Pian" y "Shilu Chunqiu Melody Pian" describen respectivamente sus principios básicos: basándose en la longitud de una cuerda, divídela en tres secciones, descarta una para obtener dos, "pierde una de cada tres" y luego pasa a cinco secciones. primera nota de grado y cuarto grado, si al tercer párrafo igual se le suma un apartado de “Terceros puntos más uno”, se emitirá la primera nota del 4º grado inferior; Si continúa calculando así, puede obtener 12 tonos, llamados "Doce Ritmos". Cada temperamento tiene un nombre legal fijo, a saber:
¿Huesos del Oráculo de Huangtai? Lin Zhong, Wu Yi, Nanying
Zhonglu Congzhong, Xian Lubin tocaron la campana.
Debido a que este "método de generación" calcula el quinto grado paso a paso, también se le llama "método de generación de cinco grados". Posteriormente, el matemático griego Zu Pitágoras (580 a. C.-501 a. C.) también utilizó el mismo método para calcular las "Doce Leyes".
Aunque los "tres puntos de pérdidas y ganancias" deducidos de las "Doce Leyes", no se pueden reciclar en el cálculo final.
Es un "doce temperamento" desigual, cada temperamento contiene una diferencia entre los semitonos mayores y menores. Por lo tanto, encontrar un sistema de temperamento igual que pueda girar libremente se ha convertido en un ideal que los musicólogos han estado persiguiendo durante más de dos mil años.
Fang Jing (77-37 a. C.), una famosa abogada de la dinastía Han, continuó leyendo la Ley de los Cinco Grados. Para la Ley 53 de "Religión Sexual", básicamente había regresado a la "Huang". Zhong" (No. El método del promedio cincuenta y tres también apareció en Europa en el siglo XVI).
Finalmente contó 60 leyes, que más tarde fueron llamadas "Leyes de Fang Jing". En la superficie, el complejo sistema legal de Fang Jing para calcular sesenta leyes es completamente diferente del simple ideal de la Ley Promedio Doce. Pero si dejas de lado su manto de misticismo, se pueden aprender muchas de las alturas legales que obtuvo durante su operación. el pasado. Esto lo confirma el "ritmo de campana" encarnado en las campanadas de Hou Yi. Qian Lezhi y Shen Zhong en las Dinastías del Sur continuaron derivando la regla del día de cumpleaños basada en la "dicotomía de pérdidas y ganancias" basada en las Seis Reglas de Fang Jing, hasta que alcanzaron las Trescientas Sesenta Reglas más detalladas. Minimizaron el número de diferencias de tono en el temperamento fundamental de Huang Zhong, proporcionando así una mayor posibilidad de seleccionar los doce tonos de temperamento iguales. Pero al mismo tiempo, la exploración de la solución de los doce temperamentos iguales a lo largo de este camino también ha entrado en el dilema "sin agua".
Casualmente, He Chengtian (370-447), un musicólogo contemporáneo de Qian y Shen) propuso audazmente una "nueva ley". Lo que hizo fue dividir los errores restantes que las Doce Leyes no pudieron recuperar en doce partes, una para cada ley.
Después de doce generaciones, regresó a Huang. Se puede decir que ésta es la concepción genial de la ley de los doce iguales. En ese momento, He Chengtian casi llamó a la puerta de este sistema legal impredecible. Desafortunadamente, no calculó por relación de frecuencia, sino por longitud de cuerda, y el problema quedó archivado nuevamente. Liu Zhuo (581-618) de la dinastía Sui se deshizo de los grilletes de la "ley de pérdidas y ganancias de los tres tercios" y calculó la "ley de diferencias iguales de doce longitudes" basada en la misma diferencia de las leyes adyacentes de vibración. longitudes del cuerpo. En 1959, Wang Shu (905-959) propuso una nueva ley, que se ajustó rígidamente utilizando el intervalo de octava de la relación de medio tiempo. Se dio cuenta claramente de que la solución de las contradicciones de la ley de desigualdad sólo puede llevarse a cabo dentro del alcance de la Ley 12, pero su método básico fue jugar con el "método de pérdidas y ganancias de tres puntos".
Después de tan largo periodo de exploración y deambulación, en plena dinastía Ming, la familia real pasó por Zhu Ga (1536-1611) y finalmente se convirtió en la primera persona en subir a la cima del Pagoda Fahua y recoja la joya de la "Ley de los Doce Igualdad". Utilizó un ábaco para calcular la progresión geométrica del sistema jurídico, resolvió por primera vez el eterno problema del palacio que gira libremente en las Doce Leyes de la Música y realizó el sueño de innumerables abogados durante miles de años. Su "nueva tasa secreta" se convirtió en uno de los descubrimientos más importantes en la historia de la ciencia humana. Como gigante de la historia del arte, Zhu ha logrado grandes logros en la ciencia, la cultura y, especialmente, en la teoría de la música tradicional. Sin embargo, su obra de toda la vida "Enciclopedia de la ley musical" cubre todos los aspectos del arte musical debido al declive de la sociedad feudal de China. Zhu inventó la "Ley de los Doce Iguales". Al final, no se llegó a poner en práctica y quedó escondido en un libro y archivado, convirtiéndose en una silueta trágica que refleja el estrangulamiento del genio por parte del imperio feudal.
Música antigua: historia del desarrollo (1)
El clásico anterior a Qin "Lu Shi Chun Qiu" decía: "¡La fuente de la música está muy lejos cuando era así!" Muy lejos, no existe un registro histórico preciso documentado, pero los artefactos musicales continuamente descubiertos prueban sus “orígenes” una y otra vez.
A principios de la década de 1950, se desenterró en las ruinas Yin de Anyang una placa de roca con estampado de tigre de la dinastía Shang, lo que demuestra que los instrumentos musicales chinos tienen una historia de más de 3.000 años. A mediados de la década de 1950, se desenterró una "caja de cerámica con un solo agujero" en el yacimiento neolítico de la aldea de Banpo, Xi'an, y el instrumento musical fue arrastrado a hace más de 6.700 años. En la década de 1970, se descubrió un gran número de "flautas de hueso" y "cajas de cerámica" que databan de más de 7.000 años en el sitio neolítico de Hemudu en Yuyao, Zhejiang... La música china es realmente como un largo río de historia, sinuoso, colorido y eterno. El río pasó de ser un hilo de agua a ser un río rugiente. En los últimos años, una excavación arqueológica en la aldea de Jiahu, condado de Wuyang, provincia de Henan, la ha extendido a una época más antigua...
La historia de la música y la literatura antigua chinas generalmente se remonta al Emperador Amarillo. . Aunque la leyenda sobre el Emperador Amarillo está mezclada con los elementos ideales de generaciones posteriores y tiene muchos elementos sobrenaturales, no es del todo creíble (por ejemplo, el establecimiento de las "Doce Leyes" en la era del Emperador Amarillo significa que la creación posterior es atribuido al Emperador Amarillo, que es diferente de los tiempos modernos). Los hallazgos arqueológicos científicos no coinciden).
Es demasiado tarde para considerar al Emperador Amarillo como la fuente de la música china: los descubrimientos arqueológicos modernos han avanzado enormemente la historia de la música china desde la era del Emperador Amarillo, ¡mucho más larga que la era del Emperador Amarillo!
En 1986 ~ 987, se desenterraron al menos 16 flautas de hueso del sitio neolítico en la aldea de Jiahu, condado de Wuyang, provincia de Henan. Según la datación por carbono 14, ¡estas flautas de hueso tienen entre 8.000 y 9.000 años! Estas flautas de hueso están hechas de huesos del cúbito de la grúa y la mayoría de ellas tienen siete agujeros perforados. Además de algunos orificios de sonido, también hay marcas de división iguales grabadas antes de perforar. Algunos orificios de sonido tienen un pequeño orificio perforado al lado, que debe usarse para ajustar el tono. Estas circunstancias al menos muestran que la gente de aquella época tenía ciertas exigencias en cuanto a la precisión del paso y tenía una comprensión preliminar de la relación entre el paso y la longitud de la tubería. Según la prueba de sonido más completa realizada por músicos, se dice que China, donde predomina la escala pentatónica, en realidad tenía una forma de escala con una estructura estable y superó la escala pentatónica hace siete u ocho mil años. (Este hecho histórico ilustra elocuentemente que la música china está dominada por la escala pentatónica. No es el llamado "desarrollo imperfecto de la escala" imaginado por algunas personas, sino el resultado de una elección histórica y estética. Esto también prueba que en En ese momento, la música china se había desarrollado a un nivel muy alto, mucho más allá de la imaginación de la gente. Antes de eso, la música china debe haber tenido un largo período histórico. Es difícil adivinar si este período fue de miles o decenas de miles de años. >
Además de las flautas de hueso, también hay flautas de hueso, platillos, campanas de cerámica, carillones y tambores neolíticos. Estos instrumentos musicales se distribuyen por la vasta tierra de China y abarcan un largo tiempo, lo que indica que fueron los instrumentos principales. En el período primitivo de China, los instrumentos musicales, entre ellos, campanillas, campanas y tambores se han desarrollado mucho en generaciones posteriores. En cuanto a los platillos y silbatos, hay instrumentos musicales con la misma forma y principio que las flautas de hueso (hoy llamados "piezas"). ), que todavía son populares entre la gente de hoy.
La piedra de entintar es un instrumento muy distintivo. Parece un huevo (o varias variaciones) y tiene aproximadamente el mismo tamaño. Un puño chino, tiene un orificio para soplar en la parte superior y uno o más orificios para los dedos en el pecho y el abdomen. A excepción de la flauta de hueso, la nube es el único instrumento que definitivamente puede producir más de un tono en la era primitiva. En la era primitiva, la nube tenía sólo de 1 a 3 tonos, lo que sólo puede producir de 2 a 4 tonos (esto probablemente esté relacionado con el hecho de que los agujeros en las pequeñas nubes con forma de huevo son más difíciles de contar. agujeros en la flauta tubular). Reflejan el proceso de desarrollo de la escala china hasta cierto punto, especialmente en la relación de intervalo que jugó un papel importante en el desarrollo de la escala china. Algunos estudiosos ahora señalan que es el intervalo pequeño; Esto se ha enfatizado repetidamente desde la boca que solo puede producir dos tonos. Este punto de vista es muy importante para comprender el desarrollo de la escala china, las escalas y los tonos, e incluso el mecanismo interno de la escala pentatónica china. , sin duda tienen un importante significado rector.
La música y la danza en la época primitiva son inseparables. Este es probablemente un fenómeno en la historia de todas las naciones del mundo, y China no es la misma excepción. En el siglo XI a.C., China había llamado "Yue" a esta forma de arte que combinaba música y danza. Incluso después de que la música y la danza se convirtieran en una forma de arte independiente, "Yue" todavía podía referirse tanto a la danza como a la música. "Música" se refiere a la música, por lo que los estudiosos generalmente llaman a la "música" en la era primitiva "música y danza". Algunas de las pinturas rupestres primitivas existentes representan vívidamente escenas de música y danza primitivas, que es una actividad de canto y baile en grupo. De los fragmentos de "memoria" conservados en documentos posteriores se desprende que la interpretación de música primitiva y danzas y sacrificios como la oración por una buena cosecha eran "uno en dos, dos en uno", por lo que deben incluir la reproducción. de las actividades de producción en la era primitiva. La música y la danza no son objetos de la división social del trabajo, y no hay músicos a tiempo completo en las sociedades primitivas. La música y la danza suelen ser todas actividades sociales en las sociedades tribales. en el período primitivo no apareció como una forma de arte especial y surgió de la sociedad.
Estrictamente hablando, la música y la danza, como división social del trabajo, sólo se independizaron verdaderamente de la sociedad después del establecimiento de. la dinastía Xia en el siglo XXI a. C. Se dice que el último monarca de la dinastía Xia temprana, Qi. Tanto He Jie como Jie alguna vez se entretuvieron con música y danza a gran escala, lo que demuestra que la sociedad de la última dinastía Xia. Produjo una gran cantidad de personal de música y danza a tiempo completo. Esto es una señal de que la música y la danza como arte son independientes de la sociedad.
Dado que la música y la danza primitivas están estrechamente integradas con la brujería, el sacrificio y otras actividades primitivas, los pensamientos misteriosos de la gente sobre la música, la danza e incluso ciertos instrumentos musicales pueden haber surgido muy temprano. Después del nacimiento del país, los gobernantes utilizarían y fortalecerían el misterioso concepto de la música para manipular y controlar la música y la danza y fortalecer su gobierno. Algunos cuentos de hadas musicales conservados son producto de este trasfondo social. Cuenta la leyenda que los monarcas de la dinastía Xia arrojaron del cielo la música y la danza a gran escala "Nine Debates" y "Nine Songs", divididas en capítulos.
De los instrumentos musicales desenterrados a principios del Período de los Reinos Combatientes (siglo V a. C.), todavía se puede ver la imagen de Kai, como si tuviera el estatus de dios de la música en ese momento. También se dice que Huangdi consiguió un animal llamado Wei, que parecía una vaca, por lo que usó su piel para cubrirlo con un tambor y usó los huesos de la bestia del trueno como baquetas para golpearlo. "Escuché que estaba a quinientas millas de distancia". Huang Di usó esto para animar al mundo. Kaihe y Kaihe son animales mágicos ficticios. De hecho, los tambores de aquella época estaban hechos de piel de vaca Meng, como en generaciones posteriores, pero muchos también estaban hechos de piel (ahora llamada de caimán), por lo que se convirtieron en materiales míticos. Más tarde, Wei se convirtió en el "hombre" (dios) a cargo de la música. Como dios encargado de la música, el tambor que domina el ritmo debe considerarse como un tortuoso reflejo del protagonismo de este instrumento en la música y la danza.
La flauta de hueso Jiahu fue desenterrada cerca de la legendaria Xiatai, lo que nos habla de que la zona de actividad de la dinastía Xia era una zona donde la música china estaba muy desarrollada. Se dice que la música y la danza de la dinastía Xia obviamente superaron a las de las generaciones anteriores, lo cual es completamente comprensible. Si los elementos míticos de Jiu Bian y Jiu Ge mencionados anteriormente son eliminados del camino del cielo, entonces sólo la realidad de Jiu Bian y Jiu Ge es verdaderamente magnífica y hermosa. Sólo de esta manera la gente puede despertar la ensoñación de que esta canción sólo debería existir en el cielo y crear aún más un mito.
1. Nombre común para reproductor MP3 portátil.
Un reproductor portátil para reproducir música en formato MP3 (ahora compatible con wma, wav y otros formatos). El reproductor MP3 portátil fue inventado originalmente por los coreanos Moon & Hwang en 1997 y solicitó las patentes correspondientes.
2.MP3 como formato de música
MPEG-1 Audio Layer 3, comúnmente conocido como MP3, es un popular formato de compresión y codificación de audio digital con pérdida. Está diseñado para reducir significativamente la cantidad de datos de audio, pero para la mayoría de los usuarios, la calidad del sonido de reproducción no se degradará significativamente en comparación con el audio original sin comprimir. Fue inventado y estandarizado en 1991 por un grupo de ingenieros del Fraunhofer-Gesellschaft, un instituto de investigación en Herlem.
Inspección general
MP3 es un formato de compresión de datos. Descarta datos de audio PCM que no son importantes para el oído humano (similar a JPEG, que es una compresión de imágenes con pérdida), lo que da como resultado archivos de menor tamaño.
En MP3 se utilizan varias técnicas, incluida la psicoacústica, para determinar qué partes del audio se pueden descartar. El audio MP3 se puede comprimir a diferentes velocidades de bits, lo que proporciona una variedad de compensaciones entre el tamaño de los datos y la calidad del sonido.
El formato MP3 utiliza un mecanismo de conversión híbrido para convertir señales en el dominio del tiempo en señales en el dominio de la frecuencia:
* Filtro de cuadratura polifásico (PQF) de 32 bandas
* Filtro de coseno discreto modificado (MDCT) de 36 o 12 tomas; el tamaño de cada subbanda puede estar entre 0...1 y 2...31.
*Postprocesamiento de atenuación de aliasing
Según la especificación MPEG, AAC (Advanced Audio Coding) en MPEG-4 será el formato MP3 de próxima generación, aunque hay muchos esfuerzos importantes para crear y promover otros formatos. Sin embargo, debido a la popularidad sin precedentes del MP3, el éxito de cualquier otro formato es actualmente poco probable. MP3 no sólo tiene un amplio soporte de software de cliente, sino que también tiene mucho soporte de hardware, como reproductores multimedia portátiles (reproductores de MP3), reproductores de DVD y CD.
Historia
Desarrollo
La codificación MPEG-1 Audio Layer 2 fue originalmente un proyecto de transmisión de audio digital (DAB) de Deutsche Fors Chungs-und verschuanstalt für Luft - Gestión de Egon Meier-Engelen de -und Raumfahrt (posteriormente llamado Deutsche Zentrum für Luft-und Raumfahrt, Centro Aeroespacial Alemán). Este proyecto es el proyecto de investigación Eureka financiado por la Unión Europea y su nombre se conoce comúnmente como EU-147. El período de investigación de la UE-147 fue de 1987 a 1994.
Hacia 1991 aparecieron dos propuestas: Musicam (llamada Layer 2) y ASPEC (Adaptive Spectrum Sensing Entropy Coding).
Se eligió el método Musicam propuesto por Philips de los Países Bajos, CCETT de Francia y el Institut für Rundfunktechnik de Alemania por su simplicidad, solidez a los errores y bajo esfuerzo computacional para una compresión de alta calidad. El formato Musicam basado en codificación de subbanda es un factor clave para determinar el formato de compresión de audio MPEG (velocidad de muestreo, estructura de cuadros, encabezado de datos, puntos de muestreo por cuadro). Esta tecnología y sus ideas de diseño están completamente integradas en la definición de formatos de audio ISO MPEG Capa I, II y posteriores Capa III (MP3). El desarrollo de las normas estuvo a cargo de Leon van der Kerkhoff (primer nivel) y Gerhard Storr (segundo nivel) bajo la presidencia del Profesor Mussmann (Universidad de Hannover).
¿Leon van der Kerkhof de Holanda, Gerhard Stoll de Alemania, Yves Fran de Francia? El grupo de trabajo compuesto por los alemanes Ois Dehery y Karlheinz Brandenburg absorbió las ideas de diseño de Musicam y ASPEC, y agregó sus propias ideas de diseño para desarrollar MP3, que puede alcanzar la calidad de sonido de MP2 de 192 kbit/s a 128 kbit/s.
Todos estos algoritmos eventualmente pasaron a formar parte del primer grupo de estándares MPEG-MPEG-1 en 1992, dando como resultado el estándar internacional ISO/IEC 11172-3 publicado en 1993. El trabajo adicional sobre audio MPEG finalmente pasó a formar parte del segundo grupo de estándares MPEG, MPEG-2, desarrollado en 1994. El nombre oficial de esta norma es ISO/IEC 13818-3, que se publicó por primera vez en 2009.
La eficiencia de compresión de un codificador suele estar definida por la tasa de bits, ya que la tasa de compresión depende del número de bits (:es:profundidad de bits) y de la tasa de muestreo de la señal de entrada. Sin embargo, a menudo hay productos que utilizan parámetros de CD (44,1 kHz, dos canales, 16 bits por canal o 2x16 bits) como referencia de relación de compresión. La relación de compresión que utiliza esta referencia suele ser mayor, lo que también ilustra el problema de la relación de compresión con pérdida. compresión.
Karlheinz Brandenburg utilizó la canción "Tom's Dinner" de Susan Weig en CD para evaluar los algoritmos de compresión MP3. Se utilizó esta canción porque su melodía suave y simple hace que sea más fácil para las personas escuchar los defectos del formato comprimido durante la reproducción. Algunas personas llaman en broma a Susan Weig la "Madre del MP3". Los ingenieros de audio profesionales utilizan extractos de audio más serios y críticos (glockenspiels, grandis, acordeón,...) para evaluar la calidad subjetiva del formato de audio MPEG.
MP3 sale al público.
Para generar archivos de audio MPEG compatibles con bits (Capa 1, Capa 2, Capa 3), los miembros del Comité de Audio MPEG de ISO desarrollaron un software de simulación de referencia llamado ISO 1172-5 en lenguaje C. En algunos sistemas operativos que no son en tiempo real, se puede demostrar la primera decodificación de audio comprimido en tiempo real basada en DSP. Algunos otros audios MPEG se desarrollaron en tiempo real para transmisiones digitales (DAB para radio y DVB para televisión) para receptores y decodificadores de consumo.
Más tarde, el 7 de julio de 1994, Fraunhofer-Gesellschaft lanzó el primer codificador MP3 llamado l3enc.
El equipo de desarrollo de Fraunhofer eligió la extensión .mp3 (anteriormente .bit) en julio de 1995. Mucha gente puede utilizar el primer software en tiempo real WinPlay 3 (65438+ lanzado el 9 de septiembre de 1995) para codificar y reproducir archivos MP3 en sus computadoras personales. Debido a que los discos duros en ese momento eran relativamente pequeños (como 500 MB), esta tecnología era importante para almacenar música de entretenimiento en las computadoras.
MP2, MP3 e Internet
En junio de 1993 aparecieron en Internet archivos (MPEG-1 Audio Layer 2), que a menudo se reproducían con reproductores de audio MPEG. Más tarde, Tobias. Apareció Bading MAPlay desarrollado para Unix. MAPlay se lanzó por primera vez el 22 de febrero de 1999 y ahora se ha adaptado a la plataforma Microsoft Windows.
Al principio, los únicos productos codificadores de MP2 eran Xing Encoder y CDDA2WAV, un extractor de CD que convertía pistas de CD al formato WAV.
El Internet Underground Music Archive (IUMA) es ampliamente considerado como el creador de la revolución de la música en línea. IUMA es el primer sitio web de música de alta fidelidad en Internet. Antes de que los MP3 e Internet se hicieran populares, había miles de registros MP2 con licencia.
Desde la primera mitad de 1995 hasta finales de los 90, el MP3 comenzó a florecer en Internet. La popularidad del MP3 se debe principalmente al éxito de empresas y paquetes de software como Winamp lanzado por Nullsoft en 1997 y Napster lanzado por Napster en 1999. Promueven el desarrollo mutuo. Estos programas permiten a los usuarios normales reproducir, crear, disfrutar y recopilar archivos MP3 fácilmente.
El debate sobre la tecnología peer-to-peer para compartir archivos MP3 se ha extendido rápidamente en los últimos años, principalmente porque la compresión hace posible el intercambio de archivos, mientras que los archivos sin comprimir son demasiado grandes para compartirlos. Debido a que los archivos MP3 se distribuyen ampliamente a través de Internet, algunos de los principales fabricantes de discos han demandado a Napster para proteger sus derechos de autor (consulte Derechos de propiedad intelectual).
Los servicios comerciales de distribución de música en línea, como iTunes Music Store, a menudo eligen otros formatos de archivos de música propietarios que admiten la gestión de derechos digitales (DRM) para controlar y restringir el uso de la música digital. Los formatos habilitados para DRM se utilizan para proteger el material protegido por derechos de autor contra infracciones, pero la mayoría de los mecanismos de protección pueden romperse mediante algunos métodos. Los expertos en informática pueden utilizar estos métodos para generar archivos desbloqueados que se pueden copiar libremente. Una excepción notable es el formato Windows Media Audio 10 de Microsoft, que aún no ha sido descifrado. Si desea obtener archivos de audio comprimidos, la secuencia de audio grabada debe comprimirse y la calidad del sonido se reducirá.
Calidad de audio MP3
Debido a que MP3 es un formato con pérdida, ofrece muchas opciones diferentes de "tasa de bits", es decir, se utiliza para representar cada número de bits de datos codificados necesarios para segundos de audio. Las velocidades típicas están entre 128 y 320 kb por segundo. En comparación, la tasa de bits del audio sin comprimir en un CD es de 1411,2 kbit/s (16 bits/muestra × 44100 muestras/s × 2 canales).
Los archivos MP3 codificados con tasas de bits más bajas generalmente tienen una calidad de reproducción peor. Si la tasa de bits es demasiado baja, aparecerán "artefactos de compresión en:" (sonidos que no se encuentran en la grabación original) durante la reproducción. Un buen ejemplo de ruido de compresión es la compresión de los aplausos: debido a su aleatoriedad y cambios bruscos, los errores del codificador serán más pronunciados y sonarán como un eco.
Además de la velocidad de bits del archivo codificado, la calidad de los archivos MP3 también está relacionada con la calidad del codificador y la dificultad de codificación de la señal. Algunas personas piensan que la calidad del sonido del MP3 de 128 kbit/s y del CD de 44,1 kHz es similar a la del CD, y que la relación de compresión es de aproximadamente 11:1. A este ritmo, un MP3 correctamente codificado puede lograr una mejor calidad de sonido que la radio FM y las cintas de casete, principalmente debido a las limitaciones de ancho de banda, relación señal-ruido, etc. de esos medios analógicos. Pero las pruebas de escucha muestran que los oyentes pueden distinguir de manera confiable entre un MP3 de 128 kbit/s y un CD original con una simple prueba de práctica. En muchos casos, piensan que la calidad del sonido del MP3 es demasiado baja e inaceptable. Sin embargo, otros oyentes encontraron que la calidad del sonido era aceptable en otro entorno, como en un coche ruidoso o en una fiesta. Obviamente, los fallos en la codificación MP3 no son evidentes en los altavoces de los ordenadores de gama baja, pero en un sistema estéreo de alta calidad conectado al ordenador, especialmente cuando se utilizan auriculares de alta calidad, los fallos son más evidentes.
Fraunhofer Gesellschaft (FhG) anunció las siguientes tasas de compresión y velocidades de datos de MPEG-1 capas 1, 2 y 3 en su sitio web oficial para comparar:
*Capa 1: 384 kbit /s, relación de compresión 4:1.
*La segunda capa: 192...256 kbit/s, relación de compresión 8:1...6:1.
*La tercera capa: 112... 128 kbit/s, relación de compresión 12: 1...10: 1.
Las diferencias entre las diferentes capas se deben a sus diferentes modelos psicoacústicos; el algoritmo para la capa 1 es bastante simple, por lo que la codificación transparente requiere una tasa de bits más alta. Sin embargo, dado que diferentes codificadores utilizan modelos diferentes, es difícil hacer una comparación tan completa.
Mucha gente cree que las citas están muy distorsionadas debido a la preferencia por los registros de capa 2 y 3. Creen que la proporción real es la siguiente:
*Capa 1: 384 kbit/s es excelente.
*Capa 2: 256...384 kbit/s es excelente, 224...256 kbit/s es bueno y 192...224 kbit/s es bastante bueno.
*Tercera capa: 224...320 kbit/s es excelente, 192...224 kbit/s es bueno, 128...192 kbit/s es bueno.
A la hora de comparar mecanismos de compresión, es importante utilizar códecs con la misma calidad de sonido. Comparar un codificador nuevo con un codificador más antiguo que se basa en tecnología obsoleta o incluso tiene fallas puede producir resultados desfavorables para el formato anterior. Dado que la codificación con pérdida perderá información, el algoritmo MP3 intenta garantizar que el oído humano no reconozca las partes descartadas (por ejemplo, debido al enmascaramiento de ruido) mediante la construcción de un modelo de las características generales de la audición humana. Diferentes codificadores pueden lograr esto. en diversos grados.
Algunos codificadores posibles:
* LAME fue desarrollado por primera vez por Mike Cheng a principios de 1998. Comparado con otros productos, es un codificador MP3 que sigue completamente la LGPL. Tiene buena velocidad y calidad de sonido, e incluso desafía las versiones posteriores de la tecnología MP3.
*Fraunhofer AG