Principales problemas del reconocimiento de voz de personas no específicas
1. Reconocimiento y comprensión del lenguaje natural. Primero, el habla continua debe descomponerse en unidades como palabras y fonemas, y luego debe establecerse una regla para comprender la semántica.
2. Hay una gran cantidad de información de voz. Los patrones de habla no sólo son diferentes para diferentes hablantes, sino también para el mismo hablante. Por ejemplo, si un hablante habla de manera informal y seria, el mensaje de voz será diferente. La forma en que una persona habla cambia con el tiempo. Uno puede imaginar lo difícil que es reconocer las voces de diferentes hablantes.
3. La ambigüedad del habla. Diferentes palabras pueden sonar similares cuando el hablante habla. Esto es común tanto en inglés como en chino.
4. Las características fonéticas de una sola letra o palabra se ven afectadas por el contexto, cambiando el acento, el tono, el volumen y la velocidad de pronunciación.
5. El ruido y las interferencias ambientales tienen un impacto grave en el reconocimiento de voz, lo que resulta en una baja tasa de reconocimiento.