Red de Respuestas Legales - Derecho de patentes - Xiaomi y Huawei apuestan por las funciones de asistente de voz, pero ¿se están volviendo inútiles?

Xiaomi y Huawei apuestan por las funciones de asistente de voz, pero ¿se están volviendo inútiles?

Han pasado casi diez años desde que Apple integró Siri en el iPhone 4S en 2011, y ha pasado casi una década desde que aparecieron los asistentes de voz en los teléfonos inteligentes. Con la madurez del reconocimiento de voz y la tecnología de inteligencia artificial, esta función se ha popularizado por completo en los teléfonos móviles y se ha expandido a televisores inteligentes, hogares inteligentes y otros campos.

De hecho, las funciones que aporta la tecnología de IA por voz ya no se limitan a simples asistentes virtuales, sino que se han desarrollado aplicaciones más prácticas, como la entrada de voz y la traducción de voz, que han penetrado en todos los aspectos de nuestras vidas.

Cuando se lanzó por primera vez el asistente de voz de Apple, Siri, causó un gran revuelo. En aquel momento, algunos desarrolladores privados incluso produjeron los correspondientes complementos de Cydia, que permitían a los dispositivos iOS sin soporte oficial utilizar la función de asistente de voz después de haber sido liberados.

El asistente de voz realiza la interacción persona-computadora a través de la voz y tiene la función de asistente virtual. Esta forma fue muy novedosa en su momento y despertó la curiosidad de muchos usuarios.

Apple ha dado un paso adelante, impulsados ​​por la fuerte demanda del mercado, otros fabricantes de tecnología también han lanzado funciones de asistente de voz. En 2011, Google añadió una función de búsqueda por voz al motor de búsqueda del navegador Chrome para satisfacer las necesidades de entrada de voz de los usuarios.

En 2013, el asistente de voz de Microsoft, Cortana, se lanzó en Windows Phone. Cortana demuestra las ventajas técnicas de Microsoft acumuladas durante muchos años en el campo del reconocimiento de voz. En lo que respecta a la experiencia del usuario, el efecto de voz de "Cortana" es muy cercano al de una persona real, y casi puede lograr el efecto de falso y real, y de repente tiene innumerables fanáticos.

Al mismo tiempo, las empresas nacionales de inteligencia artificial de voz también están lanzando activamente productos similares. Por ejemplo, iFlytek ha lanzado una aplicación de asistente de voz y también es socio de fabricantes nacionales de teléfonos móviles como Meizu y OPPO. Muchos asistentes de voz o asistentes inteligentes en los teléfonos móviles de los usuarios utilizan la tecnología de reconocimiento de voz de iFlytek.

Sin embargo, a medida que los asistentes de voz se vuelven populares y maduros rápidamente en los teléfonos móviles, el entusiasmo de todos por ellos parece estar desvaneciéndose lentamente. En lo que respecta a mi experiencia personal, es raro ver a alguien usando la función de asistente de voz de un teléfono móvil en público, aunque cada vez más fabricantes están aumentando considerablemente la prioridad de los asistentes de voz, como agregar botones físicos de IA independientes e integrarlos. AI El interruptor del asistente de voz está colocado en un lugar visible del escritorio.

A muchas personas, incluyéndome a mí, no les gusta usar asistentes de voz porque no son fáciles de usar o son incómodos de usar. En la actualidad, las capacidades de reconocimiento de voz de los asistentes de voz convencionales son generalmente sólidas, pero aún pueden ocurrir vuelcos, especialmente en situaciones donde el ambiente es ruidoso y la semántica del habla es ambigua (o la pronunciación del mandarín es inexacta). En muchos casos, la operación manual directa es mucho más conveniente que pedir ayuda al asistente de voz.

Es fácil de entender si es incómodo de usar. Al utilizar asistentes de voz en público, por un lado, debes superar la vergüenza de hablar con tu teléfono móvil en público y, por otro, debes cuidar tu privacidad para que no quede expuesta.

A partir de ahora, los teléfonos inteligentes son bastante omnipresentes y nos hemos vuelto muy competentes en el manejo de esta necesidad. Muchas veces, no necesitamos la voz como forma interactiva para lograr diversas funciones. En este caso, la función de voz del teléfono móvil a veces da a la gente una sensación de mal gusto.

Las funciones de voz brillan en el Internet de las cosas

La tecnología de IA de voz no se limita a los teléfonos inteligentes, sino que se extiende a otros productos. Hoy en día, ya sean parlantes inteligentes, televisores inteligentes o un flujo interminable de productos de hardware inteligentes, siempre que se llamen "inteligentes", la función de control por voz es indispensable.

Curiosamente, en el entorno doméstico, las ventajas de la tecnología de IA de voz parecen liberarse más plenamente. En escenarios más privados, nuestra disposición a utilizar la interacción por voz ha aumentado considerablemente. En un entorno relativamente cerrado, los usuarios no tienen que preocuparse por cuestiones de privacidad, sus defensas psicológicas se reducirán y, naturalmente, aumentará la posibilidad de intentar la interacción por voz.

Para productos como los altavoces de TV, las herramientas de control tradicionales no son más que botones físicos o mandos a distancia. En cambio, la ventaja de la voz es que libera las manos del usuario.

En un entorno doméstico, los usuarios pueden utilizar directamente comandos de voz para implementar la reproducción de audio y vídeo, el control del hogar y otras funciones cuando no pueden realizar las tareas domésticas, lo que sin duda mejora enormemente la eficiencia y la experiencia del usuario.

En los últimos años, tanto las pantallas inteligentes como algunas marcas de televisores de alta gama han mejorado el efecto de captación de sonido de los dispositivos de pantalla grande. Al agregar un micrófono de radio, los usuarios pueden activar el dispositivo de TV como un centro de control inteligente en cualquier momento y en cualquier lugar. En la actualidad, la industria cree en general que la popularización de 5G y la banda ancha en el futuro, así como el mayor desarrollo de la tecnología de inteligencia artificial, nos llevarán a una era de Internet de todo.

Cuando todos los dispositivos eléctricos a los que tenemos acceso puedan conectarse a Internet y tengan funciones inteligentes, cómo controlarlos cómodamente se convertirá en la cuestión más crítica. Actualmente, la voz es la forma más barata y cómoda de aprender.

5G, IA, IoT, Internet of Everything... Respecto al futuro, los fabricantes de tecnología ambiciosos no quieren perdérselo. Apple, Google, Xiaomi y otras empresas. Reforzan constantemente la presencia de la tecnología de inteligencia artificial de voz en los sistemas de telefonía móvil. En gran medida, planifican con anticipación y cultivan constantemente los hábitos de los usuarios, para que el grupo objetivo pueda integrarse inconscientemente en el ecosistema establecido por el fabricante.

Para ciertos grupos de personas, la voz es una tecnología revolucionaria.

Además, es innegable que para algunos grupos específicos de personas, las tecnologías de voz relacionadas con la IA desempeñan un papel importante en la promoción de Internet móvil y la vida inteligente.

Para muchos usuarios "mayores", escribir con un teclado virtual en un teléfono móvil es demasiado caro y difícil de aprender. Debido a esto, a muchas personas mayores les gusta enviar mensajes de voz muy largos cuando conversan en WeChat, lo que molesta a muchas personas y les hace desear que WeChat pudiera desactivar la función de voz.

Pero ahora las aplicaciones sociales como WeChat y algunos métodos de entrada de terceros ya admiten la función de entrada de voz, que puede convertir la voz en texto. A juzgar por el nivel técnico actual, la precisión del reconocimiento y la usabilidad de la entrada de voz convencional ya son bastante altas. Para dispositivos de pantalla pequeña, como relojes inteligentes, el control por voz suele ser mucho más conveniente que el funcionamiento táctil.

Además, para algunas personas con discapacidad visual, el desarrollo de la tecnología de inteligencia artificial de voz ha reducido considerablemente su umbral para utilizar dispositivos inteligentes y disfrutar de la vida en Internet móvil. Anteriormente hemos probado algunas aplicaciones convencionales en la vida diaria. A través de la interacción de voz y botones físicos, las personas ciegas pueden completar fácilmente muchas operaciones y utilizar muchas funciones.

Te guste o no, el desarrollo de la tecnología de Internet en los últimos años es un proceso de invasión constante del espacio de privacidad de los usuarios. Incluso Apple, que siempre ha afirmado respetar la privacidad de los usuarios, estuvo expuesta a problemas de privacidad en 2019. Los datos de voz del usuario cargados por Siri se pueden obtener y analizar manualmente.

El equilibrio entre privacidad y tecnología también es un problema al que se enfrentan las empresas que desarrollan inteligencia artificial por voz. En teoría, para que la función de voz sea más fácil de usar y más inteligente, es necesario analizar y optimizar los datos de voz del usuario. La pregunta clave es qué tan probable es que la información recopilada se vea comprometida y utilizada ilegalmente.

El año pasado, la consultora Accenture realizó una encuesta entre usuarios chinos. Los datos muestran que la satisfacción de los usuarios chinos con los asistentes de voz llega al 97, pero su nivel de confianza aún no es alto. Las principales preocupaciones de los usuarios chinos sobre los asistentes de voz son los problemas de seguridad, la falta de comprensión de las necesidades del usuario y los problemas de privacidad.

Y después de algunos incidentes negativos, como el robo de cámaras web y la venta de datos de apertura de habitaciones, los consumidores nacionales se han vuelto más atentos a las cuestiones de privacidad.

En 2018, la Unión Europea aprobó el reglamento de protección de datos personales más estricto GDPR, que aclaraba que los usuarios tienen control absoluto sobre los datos personales, y las sanciones por violaciones corporativas también son extremadamente severas, con una multa mínima de 10 mil millones de euros.

Desde la perspectiva del usuario, esto podría ser algo bueno, ya que frenaría el mal uso corporativo de los datos de los usuarios y las violaciones de la privacidad. Sin embargo, restricciones demasiado estrictas también harán que a las empresas de tecnología les resulte más difícil promover avances tecnológicos que requieran big data, como la inteligencia artificial de voz.

Si miramos a más largo plazo, creemos que en la vida tecnológica futura, la importancia de la voz en la interacción persona-computadora aumentará enormemente, e incluso se convertirá en el método de operación más importante en escenarios como como hogares inteligentes.

Sin embargo, esperamos que en este proceso nuestros datos personales también sean tratados de forma más adecuada.