Casa > Noticias > Noticias de la Industria > Encontrar fabricantes chinos d.....

Noticias

Encontrar fabricantes chinos de proveedores de fábrica de traductores de voz AI, tres tecnologías y

  • Autor:Angie
  • Fuente:original
  • Suelte el:2018-11-28
Encontrar fabricantes de proveedores de fábrica traductor de voz AI,
Tres tecnologías y dos principios que debes conocer.



El traductor de voz instantáneo estalló en 2018, hay una gran cantidad de diferentes tipos de máquinas de traducción de voz en el mercado, con un rango de precios de $ 60 a $ 280, y la calidad del producto varía. Aunque este tipo de producto aún se encuentra en la etapa de actualización y exploración continuas, el lanzamiento inicial del producto ha provocado una gran respuesta en el mercado.

La mayoría de las empresas especializadas en traductores de voz utilizan un solo motor que conduce al reconocimiento del idioma de fallas y al proceso inestable y lento.
Voice Translator de XYX combina la tecnología con Google, Microsoft, Baidu, Nuance e IFLYTEK, que se pueden traducir automáticamente 2 MS y la exactitud es hasta 97%.  aquí es la videos de traductor de voz en Youtube: 
https://youtu.be/iv9zLa5mrY8
https://youtu.be/R8tC1RBdfiM



   Profesional OEM ODM


1.Speech de reconocimiento y tecnología de procesamiento.

IFLYTEK

IFLYTEK es una empresa nacional de software de backbone, especializada en Investigación inteligente de tecnología del habla y lenguaje., software y & Desarrollo de productos chip y servicio de información lingüística en China.

los La tecnología básica del lenguaje de IFLYTEK. Representa el nivel más alto del mundo. En la síntesis de idiomas, el reconocimiento de idiomas, las pruebas orales y otras tecnologías tienen resultados líderes internacionales.

En la actualidad, su nube de voz tiene la tecnología de reconocimiento de voz continua líder a nivel internacional, que puede retroalimentar los resultados del dictado rápidamente para una corrección dinámica en tiempo real, lo que hace que la precisión del reconocimiento sea superior al 95%.

Matiz


Nuance es la compañía más grande especializada en el desarrollo y venta de software de reconocimiento de voz en el mundo, como un conocido proveedor de soluciones de voz e imagen, y el patrocinador de la tecnología de reconocimiento de voz Siri de Apple. Los servicios de tecnología de voz de Nuance incluyen búsqueda de voz en línea, navegación de idiomas, etc.





2. Tecnología de búsqueda inteligente.

Sus tecnologías principales incluyen tecnología de razonamiento automático, sistema de conocimiento ontológico, sistema experto, etc. Presta más atención a la integración de otras ciencias, búsqueda personalizada e inteligencia superior.
En otras palabras, es una tecnología de búsqueda muy inteligente y centrada en el usuario que necesita comprender las necesidades de los usuarios.


3. Tecnología de Inteligencia Artificial.

La tecnología de inteligencia artificial en los últimos años se actualiza constantemente y el mercado aplicado también es muy activo. El principio es simplemente entender y responder al comportamiento humano. El producto del lenguaje se refleja en el aprendizaje y la actualización del sistema de lenguaje de acuerdo con los hábitos de expresión de los usuarios, para adaptarse a los hábitos de los usuarios y realizar la función de actualización del servicio.

Inteligencia artificial utilizada en el módulo de back-end del traductor de voz. Hay un módulo de retroalimentación "adaptativo" en el fondo de la máquina de traducción de voz, que puede mantener el autoaprendizaje de acuerdo con la voz del usuario, para hacer la "corrección" necesaria al "modelo acústico" y al "modelo de voz", y más Mejorar la precisión de reconocimiento.




4. Principio de trabajo de la máquina de traducción de idiomas

  1) Todo el proceso de construcción del sistema de reconocimiento de voz incluye dos partes: capacitación y reconocimiento.

La formación suele completarse fuera de línea. El procesamiento de señales y la extracción de conocimiento se llevan a cabo en las bases de datos masivas de voz y lenguaje previamente recolectadas para adquirir el "modelo acústico" y el "modelo de idioma" requeridos por el sistema de reconocimiento de voz. El proceso de reconocimiento generalmente se completa en línea y el habla en tiempo real de los usuarios se reconoce automáticamente.

  2) El proceso de reconocimiento se puede dividir en dos módulos: "front end" y "back end"
El módulo "front-end" se utiliza principalmente para la detección de puntos finales (eliminación de sonidos silenciados y sin voz), reducción de ruido, extracción de características, etc. La función del módulo "back-end" es utilizar el "modelo acústico" entrenado y "Modelo de lenguaje" para llevar a cabo el reconocimiento de patrones estadísticos (también conocido como "decodificación") en los vectores de características del habla del usuario para obtener la información de texto contenida en el mismo.

  3) También hay un módulo de retroalimentación "adaptativo" en el módulo de back-end, que puede adaptarse y mantener el autoaprendizaje de acuerdo con la voz del usuario, a fin de realizar la "corrección" necesaria al "modelo acústico" y al "modelo de voz", lo que mejora aún más la precisión del reconocimiento.






点击这里给我发消息