Artefacto de traducción: ¿Dónde está el conocimiento de la "traducción continua"? ¿Cómo utilizar este gadget?
¿Tu amigo entiende estos idiomas? ¡Me temo que la mayoría de la gente tiene que utilizar una herramienta de traducción para entenderlo todo!
La gente vive en diferentes lugares y habla diferentes idiomas. Es el surgimiento de la traducción lo que hace posible la comunicación entre regiones y entre idiomas. Para facilitar la comunicación, las herramientas de traducción se actualizan constantemente y las funciones de traducción son cada vez más potentes, desde la traducción palabra por palabra hasta la traducción de sitios web, imágenes e incluso documentos.
Por lo tanto, con el fin de brindar servicios de traducción más inteligentes y considerados para que todos puedan comunicarse con el resto del mundo, Huawei EMUI ha lanzado sucesivamente traducción de voz, traducción AR y traducción de pantalla completa. Esta vez, la tecnología negra de Huawei para la traducción de textos largos: ¡la traducción continua también está en escena!
La traducción a pantalla completa no es suficiente, la traducción con desplazamiento es una de las mejores.
¿Te encuentras a menudo con esta situación: al escribir un artículo, las referencias extranjeras son muy numerosas? ¿Le sorprende la guía de idiomas extranjeros cuando viaja al extranjero? ¿Quieres ponerte al día sobre un sitio de moda en el extranjero, pero no puedes entender las noticias?
Si deseas traducir contenido multipantalla, debes realizar la traducción a pantalla completa repetidamente. A medida que aumenta la extensión del contenido, la complejidad de la operación también reducirá la coherencia de la lectura. Ante tal escena, la traducción a pantalla completa se vuelve "abrumadora". ¡En este momento, se necesita traducción continua para ayudar!
Scroll Translation admite la traducción de múltiples aplicaciones, diez idiomas y contenido multipantalla. Utilice la contraseña de voz de Xiao I "Ayúdame a traducir la pantalla" o mantenga presionada la pantalla con dos dedos, haga clic en "Traducción de pantalla completa> Traducción en desplazamiento" y podrá comenzar su viaje de "Traducción en desplazamiento".
A continuación, echemos un vistazo a cómo la traducción continua completa la traducción de artículos extensos.
Maravilloso proceso: texto → imagen → traducción
Cuando navegas por un artículo extenso y necesitas traducirlo, el sistema primero tomará una captura de pantalla para formar una captura de pantalla larga del texto original. Y luego tome la captura de pantalla larga Cortar, detectar, traducir, ordenar, copiar, empalmar y finalmente presentársela nuevamente con la misma imagen y texto traducido. Esta es la llamada traducción continua.
En esta serie de pasos, lo más crítico es cómo realizar el procesamiento preliminar de capturas de pantalla largas. Entonces, ¿qué tecnología se utiliza para afrontarlo? Debo mencionar aquí la tecnología clave: la tecnología OCR.
La pregunta es, ¿dónde está el OCR?
OCR, o Reconocimiento Óptico de Caracteres, se refiere al proceso de inspeccionar, detectar e identificar caracteres y luego convertir sus formas en caracteres de computadora. La aplicación aquí es identificar y extraer caracteres en las capturas de pantalla largas formadas por el artículo extenso original y proporcionarlas para su posterior traducción automática, es decir, completar el proceso de extracción de caracteres fuente largos.
Técnicamente, es un marco algorítmico de dos etapas para detección y reconocimiento, que implica el reconocimiento de capacidades en chino, inglés, japonés, coreano, ruso, español, francés, alemán, italiano y portugués e incluye múltiples capacidades. Modelos profundos que se ejecutan en la NPU (Unidad de procesamiento de red neuronal).
Después de llamar al algoritmo OCR, primero se mejora la imagen. Después de que la imagen se adapta al estado ideal, el modelo de profundidad y las operaciones de posprocesamiento se ejecutan simultáneamente a través de subprocesos múltiples y, finalmente, el texto de salida. se reconoce a través de NLU (comprensión del lenguaje natural). Los resultados se corrigen.
La precisión de la traducción depende de la precisión del reconocimiento OCR; la velocidad de la traducción depende de la velocidad del procesamiento de caracteres OCR. La traducción automática se realiza sobre el texto procesado por OCR, las imágenes se reordenan y unen, y el texto largo traducido finalmente se presenta al usuario.
Esta solución innovadora puede convertir el texto de artículos extensos en imágenes y luego en traducciones. Ya ha solicitado protección de patente.
Cada palabra e imagen deben estar completas.
En la traducción continua, el posicionamiento de la línea de texto OCR se utiliza de manera innovadora para realizar una segmentación y empalme inteligente de imágenes, evitando inteligentemente que el texto o las imágenes se trunquen al dividir capturas de pantalla largas.
Quizás tengas esta pregunta: ¿no se puede traducir directamente la captura de pantalla larga formada por el texto original? ¿Por qué debemos hacer segmentación?
Esto se debe a que la traducción de imágenes actual solo admite la traducción de contenido de una sola pantalla. Las capturas de pantalla largas se escalarán automáticamente a la misma altura que la pantalla para la traducción. La imagen se comprimirá y el tamaño del texto. naturalmente se comprimirá. Esto afecta en gran medida la precisión de los resultados de la traducción.
Para mejorar eficazmente la precisión de la traducción, corte la captura de pantalla larga en varias imágenes cortas antes de traducirla.
Sin embargo, si simplemente divides una captura de pantalla larga según la altura de la pantalla, probablemente cortarás una línea de texto o una ilustración.
En la traducción continua, la tecnología OCR puede detectar las coordenadas de posición de una línea de texto o una imagen. Si la posición de división se encuentra en el medio de una fila o de una imagen, se moverá hasta la posición en blanco entre las filas para dividir.
El ancho de la imagen procesada de acuerdo con esta regla es el mismo que el de la pantalla y la altura es igual o ligeramente menor que la altura de la pantalla. Cada línea de texto y cada imagen están completas. Esta solución es inteligente y práctica, lo que garantiza la experiencia de traducción de todos y al mismo tiempo es rápida.
¡Actualmente, se puede experimentar la versión EMUI10 de los teléfonos móviles Huawei! El sistema se desplaza automáticamente para formar una captura de pantalla larga para traducir, lo cual es conveniente y rápido. Realmente traduce lo que ves y desplaza el texto completo.