Neues Zentrum für Künstliche Intelligenz in der digitalen Signalverarbeitung (DSAI)

Erlangen soll Leuchtturm der bayerischen KI-Forschung werden

Künstliche Intelligenz (KI) bietet eine ganze Palette neuer Lösungsansätze in der digitalen Signalverarbeitung. Zu ihrer systematischer Entwicklung wurde im Jahr 2020 ein neues Zentrum gegründet, das als Leuchtturmprojekt vom Bayerischen Staatsministerium für Wirtschaft, Landesentwicklung und Energie über fünf Jahre hinweg mit 13 Millionen Euro gefördert wird. Unter der Leitung von Dr. Frederik Nagel werden in vier Arbeitsfeldern verschiedene KI-gestützte Basistechnologien entwickelt, die zur Beratung und Lizenzierung sowie langfristig für kundenspezifische Lösungen zur Verfügung stehen. Audiosignalverarbeitung, Natural Language User Interface (NLUI), Computer Vision und Datenübertragung profitieren vom Einsatz von KI und Maschinellem Lernen und bauen unseren internationalen Vorsprung in der Signalverarbeitung weiter aus.

Audioqualität und Spracherkennung

Die Teilnehmerinnen und Teilnehmer einer Videokonferenz sind genervt. Ständig tippt jemand nebenbei auf der Tastatur und stört mit dem Geklapper alle anderen. »Mit den Methoden der Künstlichen Intelligenz sind wir zukünftig in der Lage, Sprachsignale so zu verändern, dass sie ohne Störgeräusche und fast ohne Einbußen in der Audioqualität zu verstehen sind«, stellt Dr. Frederik Nagel nicht nur den zukünftigen Teilnehmenden an Online-Konferenzen in Aussicht, sondern auch anderen Anwendungsbereichen. Beim Fernsehschauen können KI-basierte Verfahren Hintergrundgeräusche und Dialoge voneinander trennen und die Zuschauerinnen und Zuschauer können deren jeweilige Lautstärke individuell anpassen. Zudem forschen die Expertinnen und Experten im Bereich Audiosignalverarbeitung auch an Sprachassistenten für eine sichere Kommunikation, etwa mit Banken und Versicherungen, bei denen die Daten innerhalb Deutschlands bleiben.

Bildverarbeitung und Kommunikation

Müssen sich Online-Kunden derzeit noch mit einer herkömmlichen, zweidimensionalen Abbildung von E-Commerce-Artikeln zufriedengeben, wird zukünftig unter Einsatz der neuen KI-Methodik eine 360-Grad-Aufnahme detaillierte Auskunft über die Beschaffenheit der Ware liefern. »In der Bildverarbeitung erwarten wir neue Lösungen zur effizienten Generierung von virtuellen Szenen aus Einzelbildern«, kündigt der Abteilungsleiter an, »und wenn Sie sich in Zukunft nicht mehr über schlechte Netzabdeckung und geringe Robustheit der Übertragung ärgern werden, wird das zu einem Teil an der Verbindung von KI und Signalverarbeitung in Kommunikationssystemen liegen.« Seit Langem sind drahtlose Übertragungssysteme ein Kerngebiet der Fraunhofer-Forschung. Deren Einsatz bei gemeinsamen Funksystemen für Kommunikation und Radarsensing kann zu einer optimierten Ressourcenallokation beitragen und damit wertvolle Energie einsparen.

 

»Mit den Methoden der Künstlichen Intelligenz sind wir zukünftig in der Lage, Sprachsignale so zu verändern, dass sie ohne Störgeräusche und fast ohne Einbußen in der Audioqualität zu verstehen sind.«

Dr. Frederik Nagel
Abteilungsleiter AudioLabs-IIS