KI-gestützte Sprachtechnologien

Zuverlässige Sprachtechnologien haben durch die verstärkte Nutzung von Videokonferenzen und sprachgesteuerten Geräten enorm an Bedeutung gewonnen

© Fraunhofer IIS und F.M.Eckstein Fotografie
Durch den Einsatz von KI-Methoden können Störgeräusche bei Aufnahmen eliminiert werden

Das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS und das Fraunhofer IIS verfügen über weltweit einzigartige Kompetenzen im Bereich der Sprachtechnologien. Darauf aufbauend wird zusammen mit Partnern aus der deutschen Industrie ein komplett eigenes Sprachassistenzsystem entwickelt. Die dabei entstehenden Lösungen sind unabhängig von US-amerikanischen oder asiatischen Technologien und können so Datensicherheit nach europäischen Standards gewährleisten. Zur Bündelung ihrer Kompetenzen planen die beiden Fraunhofer-Institute den Aufbau eines Deutschen Zentrums für Sprachtechnologien, das im Mittelpunkt eines umfassenden Ökosystems aus Start-ups, Mittelstand, Industrie und Forschung stehen soll.

Eine besondere Herausforderung ist dabei das Lösen komplexer Aufgaben durch den Einsatz von KI. So kann z. B. mit neuronalen Netzen und Methoden des Maschinellen Lernens das Sprachsignal erkannt und bei einer Videoaufnahme von Störgeräuschen separiert werden. Die Störgeräusche werden somit effizient unterdrückt, was die Sprachverständlichkeit enorm erhöht. Bei der Sprachausgabe können mit KI natürlich klingende Stimmen erzeugt werden, die der Intonation und den Emotionen von menschlichen Sprecherinnen und Sprechern extrem nahe kommen. Durch die KI-gestützte Anpassbarkeit der Spracheigenschaften kann gezielt die Identität von Marken unterstützt werden, etwa mit der Stimme eines bekannten Sprechers.