Red de Respuestas Legales - Conocimientos legales - ¿Quién tiene un artículo sobre inventos tecnológicos?

¿Quién tiene un artículo sobre inventos tecnológicos?

Sistema de control por computadora basado en tecnología de comunicación por infrarrojos y reconocimiento de voz

1. Introducción

1.1 Tecnología de comunicación por infrarrojos [8]

A principios de la década de 1960, algunos desarrollaron The El país comenzó a estudiar tecnología de control remoto para productos civiles, pero debido a las condiciones técnicas de la época, el desarrollo de la tecnología de control remoto fue muy lento. A finales de la década de 1970, con el desarrollo de circuitos integrados y tecnología informática a gran escala, la tecnología de control remoto se desarrolló rápidamente. El método de control remoto ha pasado aproximadamente por varias etapas: del ultrasonido cableado al inalámbrico, del vibrador al infrarrojo y luego al control remoto por infrarrojos por microcomputadora mediante bus. No importa qué método se utilice, es muy importante transmitir señales con precisión y, en última instancia, lograr efectos de control satisfactorios. El dispositivo de control remoto inalámbrico original utilizaba ondas electromagnéticas para transmitir señales. Debido a que las ondas electromagnéticas son susceptibles a interferencias y son susceptibles a interferencias, gradualmente se utilizan medios ultrasónicos e infrarrojos para transmitir señales. En comparación con los infrarrojos, los sensores ultrasónicos tienen bandas de frecuencia más estrechas, pueden transportar menos información y son susceptibles a interferencias, lo que provoca un mal funcionamiento. La forma más ideal es el control de la luz. El control remoto por infrarrojos reemplazó gradualmente al control remoto ultrasónico y apareció el control remoto multifunción por infrarrojos, convirtiéndose en la corriente principal de la era actual. Debido a que el infrarrojo está fuera de la luz visible en el espectro, tiene fuertes características antiinterferencias y de propagación lineal de las ondas de luz, y no es fácil interferir entre sí. Es un buen medio de transmisión de información. La información se puede modular y transmitir directamente mediante luz infrarroja. Por ejemplo, la información se puede modular directamente mediante la intensidad de la luz infrarroja para la transmisión. La luz infrarroja también se puede utilizar para generar una onda portadora de una determinada frecuencia, y luego se puede utilizar la onda portadora. Se modula con información y luego el receptor elimina la onda portadora para obtener la información. En términos de transmisión confiable de información, el último método es mejor, y este es también el método utilizado por la mayoría de los controles remotos por infrarrojos que vemos hoy. En la última década, la tecnología de control remoto por infrarrojos se ha desarrollado rápidamente, especialmente en los campos de electrodomésticos como televisores en color, DVD y aires acondicionados. , también se ha utilizado ampliamente en otros campos de la electrónica. Con la mejora del nivel de vida de las personas y la búsqueda de productos más convenientes e inteligentes, la tecnología de control remoto por infrarrojos es una dirección de desarrollo clave.

El infrarrojo es una onda electromagnética con una longitud de onda entre 750 nm y 1 mm. Su frecuencia es superior a la de las microondas y inferior a la de la luz visible. Es un tipo de luz invisible al ojo humano. La comunicación por infrarrojos generalmente utiliza rayos infrarrojos cercanos en la banda infrarroja, con longitudes de onda entre 0,75 um y 25 um. Casi todos los controles remotos de electrodomésticos que se utilizan actualmente utilizan tecnología de transmisión por infrarrojos. Como método de transmisión de LAN inalámbrica, la mayor ventaja del modo infrarrojo es que no está sujeto a interferencias de radio y su uso no está restringido por la Comisión Estatal de Regulación de Radio. Después del establecimiento de la Asociación de Datos Infrarrojos (IRDA), para garantizar que los productos infrarrojos de diferentes fabricantes puedan obtener los mejores resultados de comunicación, el protocolo de comunicación por infrarrojos limita el rango de longitud de onda de las ondas de luz utilizadas en la comunicación de datos por infrarrojos a 850-900 nm.

1.2 Tecnología de reconocimiento de señales de voz

El reconocimiento de voz es una máquina de alta tecnología que convierte las señales de voz en archivos de texto o comandos correspondientes a través del proceso de reconocimiento y comprensión. Como campo de investigación especial, el reconocimiento de voz es un tema interdisciplinario que está estrechamente relacionado con la acústica, la fonética, la lingüística, la teoría del procesamiento de señales digitales, la teoría de la información, la informática y muchas otras disciplinas. Después de más de cuarenta años de desarrollo, el reconocimiento de voz ha mostrado grandes perspectivas de aplicación. Hasta cierto punto, la dificultad de permitir que una máquina reconozca el habla es similar a la de una persona con un idioma extranjero deficiente escuchando hablar a un extranjero. Está relacionado con diferentes hablantes, diferentes velocidades de habla, diferentes contenidos del habla y diferentes condiciones ambientales. Las características de la propia señal del habla dificultan el reconocimiento del habla. Estas características incluyen variabilidad, dinámica, transitoriedad y continuidad.

La investigación sobre el reconocimiento de voz comenzó en la década de 1950, cuando AT&T Bell Laboratories implementó el primer sistema de reconocimiento de voz que podía reconocer diez dígitos en inglés: el sistema AUDRY.

En la década de 1960, la aplicación de las computadoras impulsó el desarrollo del reconocimiento de voz. Los logros importantes de este período fueron las propuestas de programación dinámica (DP) y análisis predictivo lineal (LP), este último resolvió el problema del modelo de generación de señales de voz y tuvo un profundo impacto en el desarrollo del reconocimiento de voz.

En la década de 1970 se produjeron grandes avances en el campo del reconocimiento de voz. Teóricamente, la tecnología LP se ha desarrollado aún más y la tecnología de normalización dinámica del tiempo (DTW) básicamente ha madurado, especialmente la introducción de las teorías de cuantificación vectorial (VQ) y modelo oculto de Markov (HMM). En la práctica, se implementó un sistema de reconocimiento de voz aislado específico para cada persona basado en un cepstrum predictivo lineal y tecnología DTW.

En la década de 1980, la investigación sobre el reconocimiento de voz se profundizó aún más, y su característica notable fue la aplicación exitosa del modelo HMM y la red neuronal artificial (ANN) en el reconocimiento de voz. La aplicación generalizada del modelo HMM debe atribuirse a los esfuerzos de Rabiner y otros científicos de AT&T Bell Laboratories, quienes diseñaron el modelo matemático puro originalmente difícil del HMM para que más investigadores puedan comprenderlo y comprenderlo. Los sistemas de reconocimiento de voz creados por los modelos ANN y HMM tienen el mismo rendimiento.

En la década de 1990, con la llegada de la era multimedia, existía una necesidad urgente de que los sistemas de reconocimiento de voz pasaran del laboratorio al uso práctico. Muchos países desarrollados, como Estados Unidos, Japón, Corea del Sur, IBM, Apple, AT&T, NTT y otras empresas famosas, han invertido mucho en el desarrollo práctico y la investigación de sistemas de reconocimiento de voz.

La investigación sobre el reconocimiento de voz en mi país siempre ha ido a la par del nivel internacional y el país le concede gran importancia. La investigación sobre el reconocimiento de voz de amplio vocabulario está incluida en el plan "863" y es desarrollada conjuntamente por el. Instituto de Acústica, Instituto de Automatización y Universidad de Pekín de la Academia de Ciencias de China. En vista del enorme mercado de China en el futuro, los países extranjeros también conceden gran importancia a la investigación del reconocimiento de voz chino. Estados Unidos, Singapur y otros lugares han reunido a un grupo de académicos de China continental, la provincia de Taiwán, Hong Kong y otros lugares, y los resultados de sus investigaciones han alcanzado un nivel muy alto. Por tanto, además de fortalecer la investigación teórica, también es necesario acelerar la transformación de los sistemas de demostración de laboratorio de mi país en productos comerciales.

La investigación actual sobre el reconocimiento de voz avanza lentamente, principalmente porque no ha habido ningún avance en la teoría. Aunque están surgiendo varios métodos de corrección nuevos, su aplicabilidad general es controvertida. En concreto, las dificultades se reflejan principalmente en:

1. La escasa adaptabilidad del sistema de reconocimiento de voz se refleja principalmente en su fuerte dependencia del entorno, es decir, el sistema de entrenamiento del habla puede recopilarse en un entorno determinado. solo se puede usar en este entorno, descargue la aplicación; de lo contrario, el rendimiento del sistema disminuirá drásticamente. Otro problema es que no puede responder correctamente a la entrada incorrecta del usuario y es incómodo de usar.

2. Es difícil avanzar en el reconocimiento de voz en entornos con mucho ruido, porque la pronunciación de las personas cambia mucho en este momento, como que la voz se vuelve más fuerte, la velocidad del habla se ralentiza y la entonación y Los picos de vibración cambian. Este es el llamado efecto Lombard y es necesario encontrar nuevos métodos de análisis y procesamiento de señales.

3. Ha habido muchos resultados de investigación en lingüística, fisiología y psicología, pero aún es necesario investigar cómo cuantificar, modelar y aplicar este conocimiento al reconocimiento de voz. En el reconocimiento continuo de voz con vocabulario medio y amplio, el modelo de lenguaje, el modelo de gramática y el modelo de vocabulario son muy importantes.

4. Nuestra comprensión de la comprensión auditiva humana, la acumulación de conocimientos y los mecanismos de aprendizaje, y el mecanismo de control del sistema nervioso cerebral aún no está clara; en segundo lugar, todavía es difícil aplicar los resultados existentes en este campo al habla; reconocimiento. Es un proceso difícil.

5. Todavía quedan muchos problemas específicos que deben resolverse en la transformación de los sistemas de reconocimiento de voz de sistemas de demostración de laboratorio a productos comerciales, como la velocidad de reconocimiento, el rechazo y la tecnología de detección de palabras clave (oraciones). es decir, eliminar "" del habla continua "Ah", "Ay" y otras voces, obteniendo la parte de la voz que realmente se va a reconocer) y otros detalles técnicos deben resolverse.

Existen muchas dificultades en el reconocimiento de voz, pero la clave para un reconocimiento efectivo es su modelo y algoritmo. Los algoritmos modelo son la clave para saber si la capacidad de la computadora para describir el habla puede capturar la esencia del habla humana. En el campo del reconocimiento de voz, aunque existe competencia por la solidez financiera y los recursos humanos, lo más fundamental es la competencia por sus tecnologías centrales clave: modelos y algoritmos.

1.3 El propósito y la idea básica del diseño de este trabajo

Este trabajo utiliza una PC para realizar el control inteligente de la tecnología de control por infrarrojos y la tecnología de reconocimiento de señales de voz en electrodomésticos. o equipos eléctricos industriales, y Aplicaciones en sistemas de software para PC, como sistemas de control de electrodomésticos inteligentes y sistemas de control de enseñanza multimedia. Además, los sistemas o archivos informáticos se pueden cifrar eficazmente mediante cifrado mediante tecnología de reconocimiento de voz e infrarrojos.

Con el desarrollo de la sociedad y la mejora del nivel económico nacional, cada vez más PC han entrado en los hogares de la gente común, en los campos industriales y en los campos de enseñanza escolar. Este trabajo utiliza las potentes funciones de las PC existentes, combinadas con tecnología de control por infrarrojos y tecnología de reconocimiento de voz, para lograr un control flexible de electrodomésticos o equipos eléctricos de fábrica y un método de enseñanza multimedia animado. Sin consumir demasiados recursos de la PC, los recursos de la PC se utilizan tanto como sea posible, se minimiza el sistema de hardware frontal y se minimiza el costo.

Además, se adopta la combinación perfecta de tecnología de control inalámbrico y tecnología de comunicación por infrarrojos, lo que evita las limitaciones de espacio de la comunicación por infrarrojos puro y la incompatibilidad de la comunicación inalámbrica pura con los equipos eléctricos infrarrojos existentes, lo que hace que el control del sistema sea más flexible. Además, el sistema también puede realizar el control remoto del dispositivo conectándose a Internet.

1. Utilice el circuito de recepción de infrarrojos para identificar las señales enviadas por varios controles remotos de infrarrojos a través del puerto USB de la PC, luego analice y almacene las señales y finalmente envíelas al receptor de radio y a la transmisión de infrarrojos. Controlador a través del puerto USB, reproduce su señal de control infrarrojo, controlando así el dispositivo. Como se muestra en la Figura 1-1. En este proceso, el PC actúa como un mando a distancia de aprendizaje. En comparación con el aprendizaje de controles remotos desarrollados por microcontroladores comunes, este método tiene la ventaja de evitar mayores costos de hardware. Además, las poderosas funciones de procesamiento de la PC están fuera del alcance de los controles remotos de aprendizaje comunes.

Figura 1-1 Esquema de control del dispositivo

2. La señal de voz de este trabajo se ingresa a través del MIC y utiliza tecnología de reconocimiento de señal de voz combinada con las poderosas capacidades de procesamiento de la PC. para reconocer eficazmente las voces de diferentes personas. La señal de voz se procesa y se convierte en una señal de control infrarroja u otra señal eficaz para controlar o emitir el dispositivo de control del software de aplicación de PC.

3. El sistema está equipado con un control remoto específico para PC (como se muestra en la Figura 1-4), que se puede utilizar para controlar la capa de software de la PC y los dispositivos externos, lo que equivale a un aprendizaje. mando a distancia. Con este control remoto por infrarrojos especial se puede lograr un método de enseñanza multimedia flexible. Como se muestra en la Figura 1-3.

Figura 1-3 Control de enseñanza multimedia Figura 1-4 Control remoto específico de PC

4 Para la entrada de contraseña del teclado tradicional, los troyanos pueden registrar fácilmente la información clave ingresada o grabar su contraseña. información de pulsaciones de teclas a través de una microcámara. La tecnología criptográfica basada en análisis de infrarrojos y tecnología de reconocimiento de voz puede cifrar sistemas y archivos de manera más conveniente y efectiva.

1.4 Descripción general del nivel actual de investigación de temas similares en el país y en el extranjero

No existe un sitio web de referencia para el registro de productos en la base de datos de consultas de patentes proporcionada por la Oficina Estatal de Propiedad Intelectual de China. y la Red de Información de Patentes de China. Patente de China No hay registro de este producto en las búsquedas extranjeras vinculadas a la red de información (como la Oficina Europea de Patentes y la Oficina de Patentes de los Estados Unidos).

1. La tecnología de control remoto por infrarrojos es relativamente madura y aprender a controlar el control remoto es un buen ejemplo. Su objetivo es que el receptor del control remoto de aprendizaje registre con precisión la forma de onda del control remoto una por una, y luego reproduzca y transmita la forma de onda cuando se aplica, pero está limitado por la memoria y la señal almacenada es limitada. Después de una búsqueda de patentes, descubrimos que también existen productos para PC con control remoto por infrarrojos en el país y en el extranjero, y la empresa japonesa Tsukiji también solicitó una patente de control remoto para computadora en China. La mayoría de los productos utilizan puertos RS232 o PS2 para controlar PC, pero no existen productos basados ​​en interfaces USB para controlar electrodomésticos.

2. Hay muchos productos controlados por voz implementados a través de hardware, como perros robot de juguete inteligentes, el perro robot japonés "Aibo" y el perro robot británico "Wick", todos los cuales son mascotas electrónicas. Basado en control por voz. Pero es caro. En la actualidad, empresas famosas como IBM, Apple, AT&T y NTT han invertido mucho en el desarrollo práctico y la investigación de sistemas de reconocimiento de voz. El producto principal es el método de entrada por voz y no existe un método de control flexible que utilice la voz en el control del dispositivo.

3. Los sistemas de control inteligente del hogar implementados exclusivamente mediante hardware son tradicionalmente diversos, la mayoría de los cuales utilizan tecnologías infrarrojas e inalámbricas, pero los productos domésticos controlados por voz aún no han aparecido. Estos productos de control del hogar no tienen interfaces de computadora y no pueden lograr la administración del hogar a través de computadoras.

4. La autenticación de usuario tradicional se realiza generalmente a través del teclado, como el cifrado del sistema o el cifrado de archivos. No existe ningún método, ni en el país ni en el extranjero, para lograr la autenticación informática mediante análisis de infrarrojos o reconocimiento de voz. Las patentes registradas son productos de reconocimiento de contraseñas, generalmente bloqueos de contraseña y tecnologías de autenticación de contraseñas de comunicación.

1.5 Instrucciones de funcionamiento

1.5.1 Instalación del hardware

Inserte el micrófono en la tarjeta de sonido de la PC y conecte el receptor de infrarrojos y el transmisor de radio (Figura 1- 5) en la interfaz USB de la PC, instale el receptor de radio y el controlador del transmisor de infrarrojos (Figura 1-6) en la dirección del dispositivo controlado y luego conecte la fuente de alimentación de 220 V. Cuando el dispositivo controlado no tenga asociación de datos infrarrojos, inserte el enchufe de alimentación del dispositivo controlado en el módulo para realizar el control de energía del dispositivo.

Figura 1-5 Receptor de infrarrojos y transmisor de radio

Figura 1-6 Controlador de receptor de radio y transmisor de infrarrojos

1.5.2 Uso del software

p>

Requisitos mínimos de configuración de software: 64M de memoria, procesador Pentium 2, sistema WIN98/ME/2K/XP.

Después de instalar el software, aparecerá la ventana de control que se muestra en la Figura 1-7 e ingresará a la barra de configuración. Después de seleccionar el tipo de control remoto, apunte el control remoto del dispositivo controlado hacia el receptor de infrarrojos y el transmisor de radio (Figura 1-5) para ingresar la señal del control remoto por infrarrojos. Puede ingresar la señal de voz al mismo tiempo. Una vez completada la operación, se completa la entrada de señales infrarrojas y señales de voz, y también se pueden seleccionar otros datos de acuerdo con este método. Este trabajo no solo controla televisores, aires acondicionados y calentadores de agua, sino también la propia PC. Además, también se pueden personalizar otros equipos eléctricos. Como se muestra en la Figura 1-8, seleccione la barra de red para controlar el dispositivo remoto. Los métodos de uso específicos se proporcionan en la ayuda del software y el funcionamiento es muy sencillo.

1.6 Análisis y pronóstico del mercado

1. El costo del hardware de este producto es bajo (menos de 200 yuanes) y el dispositivo USB admite intercambio en caliente, lo que lo hace conveniente para los usuarios. instalar y usar. El sistema de software está conectado a herramientas de Microsoft Office y puede controlar el sistema audiovisual y dispositivos periféricos mediante control remoto y voz, como la presentación y conmutación de documentos multimedia, el cambio de luces y sonidos, etc.

2. El número de hogares equipados con ordenadores es enorme, lo que conlleva enormes oportunidades de negocio. Los usuarios domésticos pueden utilizar las funciones de control de entretenimiento proporcionadas por este producto, como operar reproductores de voz o video con control remoto o voz, y controlar software de juegos con control remoto y voz. Por supuesto, el control de electrodomésticos inteligentes permite a los usuarios experimentar la comodidad que ofrece la tecnología de la información. En la actualidad, con el rápido desarrollo de Internet, la mayoría de los dispositivos portátiles, excepto las PC, admiten la comunicación en red. El uso de la red para controlar de forma remota equipos eléctricos será bienvenido por todos.

3. El sistema de contraseña basado en análisis de infrarrojos y reconocimiento de voz puede evitar que otros copien o cambien la información interna de la computadora, y la operación es más fácil que la entrada de contraseña de clave tradicional. Puede mejorar enormemente la seguridad y confiabilidad de la información y la confidencialidad de los datos para individuos y empresas.