Zuhause > Nachrichten > Branchen-News > Hersteller chinesischer KI-Spr.....

Nachrichten

Hersteller chinesischer KI-Sprachübersetzer Hersteller, drei Technologien und zwei Prinzipien, die S

  • Autor:Angie
  • Quelle:Original
  • Lassen Sie auf:2018-11-28
Hersteller von AI-Sprachübersetzerfabriken finden,
Drei Technologien und zwei Prinzipien, die Sie kennen müssen



Instant Voice Translator brach im Jahr 2018, es gibt eine große Anzahl verschiedener Arten von Sprachübersetzungsmaschinen auf dem Markt, mit einem Preisbereich von 60 bis 280 US-Dollar, und die Produktqualität variiert. Obwohl sich diese Art von Produkt noch in der Phase kontinuierlicher Modernisierung und Exploration befindet, hat die erste Produkteinführung eine große Resonanz auf dem Markt hervorgerufen.

Die meisten auf Sprachübersetzer spezialisierten Unternehmen verwenden eine einzige Engine, die zur Erkennung der Fehlersprache und zu instabilen und langsamen Prozessen führt.
Voice Translator von XYX kombinieren die Technologie mit Google, Microsoft, Baidu, Nuance und IFLYTEK, die automatisch übersetzt werden können 2 MS und die Genauigkeit ist bis 97%.  Hier ist das Videos von Sprachübersetzer auf Youtube: 
https://youtu.be/iv9zLa5mrY8
https://youtu.be/R8tC1RBdfiM



   Professionel OEM ODM


1. Erkennung und Verarbeitungstechnologie

IFLYTEK

IFLYTEK ist ein nationales Backbone-Softwareunternehmen, spezialisiert auf intelligente Sprachtechnologie-Forschung, Software & Chipproduktentwicklung und Sprachinformationsservice in China.

Das Sprachkerntechnologie von IFLYTEK repräsentiert die höchste Stufe der Welt. In der Sprachsynthese haben Spracherkennung, mündliche Prüfungen und andere Technologien international führende Ergebnisse.

Gegenwärtig verfügt die Sprachwolke über die international führende kontinuierliche Spracherkennungstechnologie, mit der die Diktierergebnisse schnell zur dynamischen Echtzeitkorrektur rückgemeldet werden können, wodurch die Erkennungsgenauigkeit über 95% liegt.

Nuance


Nuance ist das weltweit größte Unternehmen, das sich auf die Entwicklung und den Vertrieb von Spracherkennungssoftware spezialisiert hat, als bekannter Anbieter von Sprach- und Bildlösungen und als Unterstützer der Siri-Spracherkennungstechnologie von Apple. Die Sprachtechnologie-Services von Nuance umfassen Online-Sprachsuche, Sprachnavigation usw.





2. Intelligente Suchmaschinentechnologie

Zu den Kerntechnologien zählen automatische Vernunftstechnologie, ontologisches Wissenssystem, Expertensystem usw. Die Integration anderer Wissenschaften, personalisierte Suche und höhere Intelligenz werden stärker berücksichtigt.
Es handelt sich also um eine sehr intelligente, benutzerzentrierte Suchtechnologie, die die Bedürfnisse der Benutzer verstehen muss.


3. Technologie der künstlichen Intelligenz

Die Technologie für künstliche Intelligenz der letzten Jahre wird ständig aktualisiert und der angewandte Markt ist auch sehr heiß. Das Prinzip besteht einfach darin, menschliches Verhalten zu verstehen und darauf zu reagieren. Das Sprachprodukt spiegelt sich im Lernen und Aktualisieren des Sprachsystems entsprechend den Ausdrucksgewohnheiten der Benutzer wider, um sich an die Gewohnheiten der Benutzer anzupassen und die Funktion der Dienstaufrüstung zu realisieren.

Künstliche Intelligenz, die im Backend-Modul des Sprachübersetzers verwendet wird. Es gibt ein "adaptives" Rückmeldungsmodul im Hintergrund der Sprachübersetzungsmaschine, das entsprechend der Stimme des Benutzers selbstlernend bleiben kann, um die "Korrektur" für das "Akustikmodell" und "Sprachmodell" und weiter vorzunehmen die Erkennungsgenauigkeit verbessern.




4. arbeitsprinzip der sprache übersetzung maschine

  1) Der gesamte Konstruktionsprozess des Spracherkennungssystems umfasst zwei Teile: Training und Erkennung.

Das Training wird normalerweise offline abgeschlossen. Signalverarbeitung und Knowledge Mining werden in den umfangreichen vorab gesammelten Sprach- und Sprachdatenbanken ausgeführt, um das vom Spracherkennungssystem erforderliche "akustische Modell" und "Sprachmodell" zu erhalten. Der Erkennungsprozess wird normalerweise online abgeschlossen, und die Echtzeitsprache der Benutzer wird automatisch erkannt.

  2) Der Erkennungsprozess kann in zwei Module unterteilt werden: "Frontend" und "Backend"
Das "Front-End" -Modul wird hauptsächlich für die Endpunkterkennung (Entfernen redundanter Mute- und Nicht-Sprachgeräusche), Rauschunterdrückung, Merkmalsextraktion usw. verwendet. Die Funktion des "Backend" -Moduls besteht in der Verwendung des trainierten "Akustikmodells" und "Sprachmodell" zum Ausführen einer statistischen Mustererkennung (auch als "Decodierung" bezeichnet) an den Merkmalsvektoren der Benutzersprache, um die darin enthaltene Textinformation zu erhalten.

  3) Im Backend-Modul befindet sich auch ein "adaptives" Rückmeldemodul, die sich an die Stimme des Benutzers anpassen und selbstlernend halten können, um die "Korrektur" für "Akustikmodell" und "Sprachmodell" erforderlich zu machen, die Erkennungsgenauigkeit weiter zu verbessern.






点击这里给我发消息