Fraunhofer upHear Voice Quality Enhancement

Übersicht

Die Fraunhofer upHear Voice Quality Enhancement Software wurde entwickelt, um sprachgesteuerte Interaktionen über eingebaute Mikrofone in Mobiltelefonen und Smart-Home-Geräten wie intelligenten Lautsprechern zu erleichtern. Sie beseitigt Störgeräusche der eingebauten Mikrofone, extrahiert die Stimme des Nutzers und neutralisiert akustische Echos, die es ansonsten unmöglich machen würden, eine Nutzer-Anfrage korrekt auszuwerten.

 

Herausforderung

Durch die rasante Weiterentwicklung im Bereich des maschinellen Lernens in den letzten Jahren verbreiten sich sprachgesteuerte Mensch-Maschine-Schnittstellen (Human-Machine-Interfaces, HMI) immer mehr. Diese sind unter anderem in Smartphones, Smart-Home-Geräten oder Automobilen zu finden. Sprachgesteuerte HMI-Systeme bestehen typischerweise aus den folgenden Bestandteilen:

  • Keyword-Spotter: zur Aktivierung des Systems
  • Automatisches Spracherkennungs-Modul (ASR): zur Umwandung von Sprache in Text
  • Linguistische Datenverarbeitung (Natural Language Understanding Interface, NLUI), um natürliche Konversation mit der Maschine zu ermöglichen
  • Modul zur maschinellen Textgenerierung (Natural Language Generation, NLG), um dem Nutzer aussagekräftige Rückmeldungen geben zu können
  • Text-to-Speech-Modul (TTS) für die Erzeugung synthetischer Sprache aus Text

Der Input für jegliche sprachgesteuerte HMI-Schnittstelle ist das von den Mikrofonen im Gerät aufgenommene Audiosignal. Besonders der Keyword-Spotter und die automatische Spracherkennung sind von der Qualität der aufgenommenen Stimme abhängig.

 

Unsere Lösung

Fraunhofer upHear Voice Quality Enhancement ist eine vollständig integrierte, flexible Lösung, die moderne Mehrkanal-Quellenlokalisierung und Beamforming-Methoden mit Algorithmen zur Echo- und Geräuschreduzierung kombiniert. Es liefert eine außergewöhnliche Audioqualität, auch unter schlechten akustischen Bedingungen. Die fortschrittliche akustische Echo-Unterdrückung ermöglicht Sprachansagen während laufender Musikwiedergabe (Barge-In).  

Auch wenn die Technologie Anwendungsszenarios mit Einzelmikrofonen unterstützt, empfehlen wir den Einsatz von Mikrofon-Arrays. Dadurch kann das Nutzererlebnis bei schwierigen Bedingungen, vor allem bei Fernfeld-Anwendungen, weiter verbessert werden.

Kontaktieren Sie uns, um Informationen zu gerätespezifischem Tuning zu erhalten und sich hinsichtlich der optimalen Mikrofonplatzierung beraten zu lassen.  

Produkteigenschaften

Fraunhofer upHear Voice Quality Enhancement verbessert die Sprachqualität durch ein optimiertes Zusammenspiel der folgenden Funktionalitäten:

  • Acoustic Echo Cancellation (AEC) unterdrückt Echos vom Gerätelautsprecher.
  • Direction of Arrival (DOA) schätzt die Richtung des Sprechers.
  • Beamforming nutzt die räumliche Verteilung der angeordneten Mikrofone, um eine richtungsorientierte Aufnahme zu realisieren und die Stimme des Nutzers selbst aus weiter Entfernung zu extrahieren.
  • Noise Reduction (NR), Enthallung (Dereverberation) und Automatic Gain Control (AGC) optimieren die Qualität der eingefangenen Sprachelemente.

Produktanforderungen

Fraunhofer upHear Voice Quality Enhancement kann individuell auf Gehäuse und Mikrofon-Konfiguration eines Geräts angepasst werden. Dies ermöglicht optimale Qualität bei gleichzeitiger Flexibilität im Produktdesign. Weithin genutzte Mikrofon-Anordnungen wie linear oder zirkular werden von Haus aus unterstützt.

Die Anzahl der Mikrofone und die entsprechend benötigte Anordnung für optimierte Multikanal-Sprachverbesserung hängen vom Anwendungsszenario sowie dem Produktdesign ab. Typisch sind 2, 4 oder bis zu 8 Mikrofone, um eine höchstmögliche Qualität zu erreichen. Die in der folgenden Grafik gezeigten Konfigurationen sind dabei lediglich als Beispiele zu verstehen.

 

Verfügbarkeit

Fraunhofer upHear Voice Quality Enhancement kann unmittelbar lizenziert werden. Die Software-Bibliothek ist verfügbar für:

  • Desktop-Plattformen (Windows, Mac, Linux)
  • Mobile Apps (iOS, Android)
  • Eingebettete Systeme (z.B. ARM Cortex)

 

Wenn Sie an einer Software-Lizenzierung interessiert sind, füllen Sie bitte das untenstehende Formular aus.

Lizenzanfrage: upHear Voice Quality Enhancement

Bitte füllen Sie für weitere Fragen zur Technologie und ihrer Lizenzierung das Formular aus und schicken Sie es dann ab.

* Required

Für welche Art der Lizenz interessieren Sie sich?
Software-Plattform
Hardware-Plattform
Anrede
Name