Las características más destacadas de la comunicación literaria
◆Arquitectura de aplicación cómoda y flexible
El eficiente servicio de síntesis de voz en red y el mecanismo de gestión centralizada de recursos basado en TCP/IP forman un cliente, un administrador de recursos y una combinación orgánica La arquitectura del servidor crea una solución flexible y escalable. Su alta disponibilidad se ha verificado en aplicaciones comerciales clave a gran escala en múltiples industrias clave, lo que garantiza servicios de voz automáticos ininterrumpidos confiables, 7×24. También admite arquitectura de aplicaciones distribuidas (tecnología patentada). El front-end responsable del análisis y preprocesamiento del texto y el back-end responsable de la síntesis de voz se pueden implementar en un servidor remoto. Solo se transmite información de texto analizada y anotada entre redes remotas, lo que reduce en gran medida los requisitos de ancho de banda de la red de las aplicaciones de voz. Es muy adecuado para aplicaciones de voz distribuidas a gran escala basadas en Internet. Interfaz de desarrollo flexible y eficiente
De acuerdo con diferentes herramientas de desarrollo, diferentes requisitos de integración y soluciones, Interactive SDK proporciona una variedad de interfaces de desarrollo, incluidas interfaces de desarrollo estándar (DLL), componentes COM, interfaces de desarrollo SAPI, etc. Los desarrolladores pueden elegir de manera flexible según las necesidades reales. Proporciona documentos y rutinas de desarrollo enriquecidos para ayudar a los socios a acelerar el proceso de desarrollo de aplicaciones de voz.
◆Configuraciones de parámetros enriquecidas y funciones de ajuste flexibles.
Proporciona funciones y herramientas ricas y completas de configuración y ajuste de parámetros dinámicos para ayudar a los usuarios a controlar y gestionar los efectos de síntesis de voz de forma flexible y eficiente. Proporciona herramientas para la configuración y gestión unificada de parámetros globales (como volumen, velocidad de conversación, tono, etc.). ), diccionario de usuario, reglas de usuario y paquetes de recursos personalizados; configuración de números, signos de puntuación y función de adición de palabras en chino e inglés, puede especificar el pinyin o los símbolos fonéticos de cada palabra, etc. Proporciona una interfaz gráfica de usuario unificada y fácil de usar para la configuración de operación, que se puede configurar y ajustar dinámicamente a través de parámetros API. También es compatible con CSSML (lenguaje de marcado de síntesis de voz chino) para marcado, descripción y control.
◆Soporta estándares abiertos
Es totalmente compatible con el "Estándar técnico general para el sistema de síntesis de voz chino" (GB/T21024-2007) y sigue las definiciones de términos, estándares de clasificación y datos. formatos de intercambio estipulados en la norma y Especificaciones de Aplicación.
La compatibilidad con el lenguaje de marcado de síntesis de voz (SSML) es parte del marco de interfaz de voz del W3C, un conjunto de especificaciones para aplicaciones de voz y la creación de aplicaciones de voz en la World Wide Web. A través de SSML, las personas pueden escuchar más voz sintetizada a través de teléfonos móviles, computadoras de escritorio y otros dispositivos, y extender la transmisión de información y computación a todos los rincones del mundo.
Es compatible con el Protocolo de control de recursos de medios (MRCP), publicado por el IETF y define el estándar de interfaz entre los servidores de medios y los recursos de voz de la red (incluidos los servidores de reconocimiento y síntesis de voz).
◆Conjunto de herramientas mejorado, eficiente y conveniente
iFlytek ha acumulado una rica experiencia práctica en el proceso a largo plazo de ayudar a los clientes a desarrollar aplicaciones y optimizar efectos. Sobre esta base, se han ido formando gradualmente una serie de componentes convenientes y eficientes, como herramientas de aplicación de voz fuera de línea, herramientas de edición visual CSSML, herramientas de conversión de formato de texto DOC/XLS, etc. El uso flexible de estas herramientas puede ayudar a acelerar el desarrollo de aplicaciones, optimizar los efectos de síntesis y facilitar el mantenimiento del sistema y el soporte técnico.
◆Compatibilidad con conjuntos de caracteres y formatos de datos de voz
Completamente compatible con conjuntos de caracteres codificados GB2312, GBK, BIG5, GB18030, UTF-8 y UNICODE, reconoce automáticamente texto UNICODE; admite múltiples formatos ( Incluyendo 6K/8K/11K/16K) los datos de voz se emiten directamente, como Wav lineal, A/U Wav, Vox, etc.
◆Amplio soporte de plataforma
Soporta sistemas operativos convencionales, el servidor es compatible con Windows, Unix, Linux y otros sistemas operativos, y el cliente es compatible con Microsoft Windows, SUN Solaris, REDHAT Linux, SUSE. Sistema operativo Linux, etc.
Hemos tenido casos de integración exitosos con plataformas relacionadas y proveedores de equipos reconocidos en la industria. A través de una estrecha cooperación con muchos proveedores de plataformas y equipos, integradores de sistemas y desarrolladores de software, podemos asegurarnos de brindar a los usuarios servicios profesionales en todo el proceso de aplicaciones de voz.
◆ CSSML, el efecto se puede mejorar más libremente.
Cssml (lenguaje de marcado de síntesis de voz chino) es una especificación de descripción de datos de voz en chino propuesta y dirigida por iFlytek. Esta norma ha recibido gran atención y apoyo por parte del Grupo Nacional de Expertos 863, la Comisión Estatal de Información y la Oficina Estatal de Supervisión Técnica. En 2005, pasó oficialmente la evaluación de la Organización Nacional de Normalización y se convirtió en una parte importante de las normas y especificaciones técnicas de síntesis de voz chinas. CSSML está diseñado y ampliado para aplicaciones Pinyin chinas, puede marcar y controlar de manera flexible varias funciones y es compatible con SSML.
Voz pregrabada, conexión fluida, aplicación sencilla.
InterPhonic proporciona una innovadora función de gestión unificada de pregrabación, utilizando la pregrabación como recurso del sistema de síntesis de voz. A través de la combinación inteligente de sonidos de indicación y plantillas de síntesis, la combinación de voz pregrabada y sintetizada. es más simple y fluido, evita cambios y transiciones frecuentes entre la reproducción de tonos rápidos y la síntesis de voz, simplifica la complejidad del proceso de solicitud y mejora aún más el efecto y la calidad del servicio.
◆La música de fondo mejora rápidamente el examen físico del usuario.
InterPhonic proporciona la primera función de sonido de fondo de la industria. A través de las herramientas simples y fáciles de usar proporcionadas por el sistema, puede agregar música de fondo de manera fácil y eficiente, ajustar la comparación de volumen entre la música de fondo y el habla sintetizada y escuchar directamente el efecto real, haciendo que el servicio de voz sea más amigable y natural.