Dialogue Enhancement

Überblick

Personalisierter Klang für Fernsehprogramme

 

Beim Fernsehen oder Radiohören war es bislang nicht möglich, die Mischung des Tons entsprechend der persönlichen Präferenzen zu verändern, um so die Sprachverständlichkeit zu verbessern. Umfragen zeigen1, dass viele Fernsehzuschauer und Radiohörer über schlechte Sprachverständlichkeit klagen – vor allem wenn Hintergrundgeräusche Dialoge im Film oder den Kommentar bei einer Sportveranstaltung stören.

Die rückwärtskompatible Fraunhofer-Technologie Dialogue Enhancement ermöglicht es, die relative Lautstärke der Sprachanteile selbst festzulegen. So kann der Zuschauer seine eigene individuelle Tonmischung in Anlehnung an persönliche Vorzüge, die Hörumgebung und sein Hörvermögen finden.

Dialogue Enhancement wurde innerhalb von DVB als "Advanced Clean Audio Services" für die Audio-Video-Toolbox standardisiert.

 

Merkmale von Dialogue Enhancement:

 

  • Die relative Lautstärke von Sprache kann durch den Nutzer individuell verändert werden
    • Beispiel: Anpassen der Lautstärke von Stadionatmosphäre und Kommentator bei einer Live-Sport-Übertragung.
    • Ergebnis: Verbesserte Sprachverständlichkeit oder stärkeres “mittendrin”-Erlebnis durch die Atmosphäre eines Live-Events.
  • Keine zusätzliche Tonspur für das Sprachsignal nötig (effizientes, für alle Rundfunkanwendungen geeignetes Verfahren)
  • Rückwärtskompatibel mit allen derzeit vorhandenen Empfangsgeräten. Diese geben die voreingestellte Tonmischung wieder

1 Vgl. Vortrag von BBC Business- und Technology-Analyst Phil Greene während des Loudness Summit in London, Dez. 2011.

Funktionsweise

Fraunhofer IIS Dialogue Enhancement Workflow
© Foto Fraunhofer IIS

Die in der Produktion getrennt vorliegenden Tonquellen (Sprache, Musik etc.) werden vor dem Abmischen analysiert. Dabei werden Informationen erzeugt, die beschreiben, welche Anteile im gemischten Signal zu welchen Ursprungssignalen gehören. Zusammen mit dem Downmix werden diese parametrischen Informationen übertragen und ermöglichen es dem Endgerät schließlich, die Mischungsverhältnisse zu ändern. So kann dann etwa die relative Lautstärke der Sprache gegenüber dem restlichen Signal modifiziert werden.

Eine detaillierte Beschreibung der Funktionsweise finden Sie auch in unserem Technical Paper zu Dialogue Enhancement (Englische Publikation).

Anwendungen

Ziel von Dialogue Enhancement ist es, Fernsehzuschauern ein personalisiertes Hörerlebnis für eine bessere Sprachverständlichkeit zu ermöglichen. Trotz der großen Bemühungen der Rundfunksender, die in den Soundmixes enthaltenen Audioelemente ausgewogen abzumischen, kann nicht für jeden Endanwender eine gute Sprachverständlichkeit garantiert werden. Denn diese wird von mehreren Komponenten beeinflusst:

 

Hörumgebung

Sowohl die Hörumgebung als auch das jeweilige Wiedergabegerät haben einen erheblichen Einfluss auf die Wahrnehmung des Hörers. So etwa beim Einsatz von Kopfhörern, wo Geräusche im Hintergrund wichtige Dialoge maskieren können. Hier wäre es von großem Vorteil, wenn sich das Lautstärkeverhältnis von Hintergrundgeräuschen und Dialog beeinflussen lässt.

 

Fremdsprachen

Fernsehprogramme in einer Fremdsprache zu verfolgen, bedarf erhöhter Konzentration. Lautere Dialoge vor leiserem Hintergrund erleichtern das Zuhören und steigern die Sprachverständlichkeit. Experimente haben gezeigt, dass eine Steigerung des Signal-Rausch-Verhältnisses um etwa 3 dB zu einer gesteigerten Sprachverständlichkeit führt, die mit der der Muttersprache vergleichbar ist1. Bei zu komplexen Sprachinhalten genügen 3 dB allerdings nicht. Warzybok et al. sprechen sich in diesen Fällen für eine Steigerung um 5 bis 10 dB aus – je nachdem wie gut der Zuschauer die Fremdsprache beherrscht2.

 

Hörvermögen

Für Zuschauer mit Hörschäden muss das Signal-Rausch-Verhältnis erhöht werden, damit sie Rundfunkprogramme ebenso genießen und verstehen können wie Normalhörende. Dabei ermöglicht bereits eine Steigerung um 1dB eine verbesserte Sprachverständlichkeit. Weitere Informationen zu den Folgen eines erhöhten Signal-Rausch-Verhältnisses finden Sie bei Brand und Kollmeier3. Heger und Holube4 sowie Kochkin5 liefern mehr Informationen zum Thema Hörverlust.

 

Dank Dialogue Enhancement kann der Fernsehzuschauer selbständig und individuell all diese Aspekte berücksichtigen und so die Sprachverständlichkeit seines Programms verbessern.

1Florentine, M. 1985., Speech perception in noise by fluent, non‐native listeners. J. Acoust. Soc. Am., Volume 77, Issue S1, pp. S106-S106.

2Warzybok, A. et al., 2010. Influence of the linguistic complexity in relation to speech material on non-native speech perception in noise. DAGA 2010, Berlin.

3Brand, T. and Kollmeier, B., 2002. Efficient adaptive procedures for threshold and concurrent slope estimates for psychophysics and speech intelligibility tests. The Journal of the Acoustical Society of America, 111(6), 2801. doi:10.1121/1.1479152

4Heger, D., and Holube, I., 2010. Wie viele Menschen sind schwerhörig? Zeitschrift für Audiologie, 49(2), pp. 61–70.

5Kochkin, S., 2005. MarkeTrak VII: Hearing loss population tops 31 million people. Hearing Review, 12(7). http://www.betterhearing.org/pdfs/Marketrak7_Kochkin_July05.pdf