DIE TON-REVOLUTION IM FERNSEHEN

Zum ersten Mal seit Jahrzehnten wird eine Revolution in Sachen Fernsehton Einzug in die Wohnzimmer halten. Während in der Vergangenheit, abgesehen von der Einführung von 5.1-Surround-Ton, das Fernsehen kaum Audio-Innovationen bot, wird der Klang im TV und Internet individuell und raumfüllend. Dank des neuen Audiocodecs MPEG-H Audio kann das TV-und Internet-Publikum künftig den Ton-Mix individuell anpassen und sogar den 3D-Klang aus dem Kino ins heimische Wohnzimmer holen.

 

Wir alle kennen die Situationen: Im Krimi vernimmt die Kommissarin einen Verdächtigen bei spannungsgeladener Hintergrundmusik. Leider wird das Gespräch durch die Musik aber schwer verständlich. Bei Sportübertragungen übertönt der Kommentator die Stadion­ atmosphäre, die wir in manchen Situationen lieber hören würden. Mit diesen und ähnlichen Beschwerden müssen sich Rundfunkanstalten weltweit immer wieder beschäftigen. Zahl­reiche Spezialisten in den Fernsehsendern bemühen sich, dem TV-Publikum einen möglichst ausgewogenen Ton-Mix zu liefern. Doch das Publikum ist zu heterogen, als dass ein Mix alle zufriedenstellen könnte. Was bislang fehlt, ist eine Möglichkeit, den Ton individuell anzupassen.

Was ebenso fehlt, ist, die raumfüllende 3D-Klangwelt aus dem Kino in das heimische Wohnzimmer übertragen zu können. Kaum mehr ein Blockbuster flimmert heute noch über die Kinoleinwand ohne natürlichen Ton aus allen Richtungen. Für die Wiedergabe des einhüllenden Raumklangs werden nicht nur Lautsprecher rund um das Publikum, sondern auch an der Decke angebracht, sodass der Klang tatsächlich raumfüllend ist und wie in einer natürlichen Umgebung von allen Seiten kommt. Dies versetzt das Publikum akustisch mitten in das Geschehen, das Kinoerlebnis wird noch unmittelbarer. Bei der Übertragung von solchen Filmen im TV oder über das Netz ist damit allerdings Schluss: 3D-Ton lässt sich heute noch nicht effizient auf die Bildschirme in den Wohnzimmern bringen. Und kaum einer mag sich vorstellen, ein 3D-Lautsprecher-Setup ins Wohnzimmer zu stellen bzw. zu hängen. Dafür sind mindestens sieben Lautsprecher notwendig – eine große Hürde für die Massentauglichkeit.

Auch die neuen Virtual-Reality-Welten und -Geräte sind ohne 3D-Sound kaum vorstellbar. Während in 360-Grad-Videos die perfekte Inszenierung einer anderen Wirklichkeit geschaffen wird, kann der Ton nicht einfach nur wie bislang als Stereoklang über die Kopfhörer wiedergegeben werden. Auch hier ist 3D-Klang notwendig, der perfekt auf das Rundumvideo abgestimmt ist und so die virtuelle Realität erst natürlich und realistisch erscheinen lässt. Ähnlich wie beim Fernsehen und Video-Streaming besteht auch hier eine der Herausforderungen darin, den Überall-Ton effizient zu übertragen.

 

© Fraunhofer IIS / viaframe
Mit MPEG-H Audio lässt sich der Audiomix individuell anpassen.

MPEG-H Audio: Audiocodiersystem der nächsten Generation

Im Bereich Audio und Medientechnologien werden schon seit vielen Jahren technische Lösungen für diese Herausforderungen entwickelt. Unsere Wissenschaftlerinnen und Wissenschaftler waren maßgeblich an der Entwicklung und Standardisierung des ISO/ MPEG-Audiocodecs MPEG-H Audio beteiligt. Dieser Enkel von mp3 wurde speziell für die Be­dürfnisse von Rundfunkanstalten und Streaming-Anbietern entwickelt, die ihrem Auditorium und ihren Kunden eine Lösung für die oben genannten Herausforderungen bieten wollen.

Personalisierbarkeit des Audiomixes

Mit MPEG-H Audio kann künftig der Audiomix individuell eingestellt werden. In welchem Umfang das möglich ist, entscheidet der Fernsehsender oder Streaming-Anbieter. Den Möglichkeiten sind kaum Grenzen gesetzt: So können z. B. Dialoge im Vergleich zu Hintergrund­geräuschen und Musik angehoben werden, um die Sprache besser zu verstehen. Auch die Wahl zwischen verschiedenen Kommentatoren bei Sportveranstaltungen kann mit MPEG-H ermöglicht werden – ebenso wie sich die Fangesänge der favorisierten Fußballmannschaft aus dem Stadion ins Wohnzimmer zu holen oder den Boxenfunk des Lieblingsfahrers bei einem Autorennen zu verfolgen. All das kann das Publikum über die Fernbedienung regeln.

»3D-KLANGWELTEN KÖNNEN AUCH IN DAS WOHNZIMMER EINZUG HALTEN.«

Auch 3D-Sound kann mit MPEG-H Audio effizient übertragen werden. Dabei werden Kanäle, Objekte und Ambisonics-Audio unterstützt. Unter Kanälen ist die herkömmliche Art der Au­dioübertragung zu verstehen, zwei Kanäle für Stereo, sechs Kanäle für Surround-Klang oder zehn Kanäle für 3D-Ton. Zusätzlich können auch Audioobjekte übermittelt werden. Objekte sind beispielsweise interaktive Elemente oder aber bestimmte 3D-Klangbestandteile, etwa ein Hubschrauber, der über das Publikum fliegt. Objekte haben gegenüber der Übertragung von Kanälen den Vorteil, dass sie individuell beeinflusst werden können und die Wiedergabe an die Abspielsituation anzupassen ist. Dazu berechnen Decoder und Renderer vor dem Abspielen der Objekte den Klang für das jeweils vorhandene Lautsprecher-Setup individuell neu. So wird eine bessere räumliche Darstellung im Vergleich zu einer rein kanalbasierten Audioübertragung erreicht. Schließlich unterstützt MPEG-H Audio auch Ambisonics-Audio. Dabei werden weder Kanäle noch Objekte übertragen, sondern eine mathematische Beschreibung des Soundfelds, das mit einer speziellen Mikrofonanordnung aufgenommen wurde. Da für eine akzeptable Qualität eine kompakte Mikrofonierung ausreichend und die Wiedergabe über Kopfhörer einfach möglich ist, sind Ambisonics-Aufnahmen bei Produzen­ten von VR-Inhalten beliebt.

3D-Sound auch im Wohnzimmer

Im Ergebnis lässt sich mit MPEG-H Audio 3D-Klang flexibel und äußerst effizient übertragen, bei Datenraten, wie sie heute vielfach für Surround-Ton üblich sind. Damit bleiben die 3D-Klangwelten nicht mehr nur auf das Kino beschränkt, sondern können auch in das Wohnzimmer Einzug halten.

Unser Audio-Team konnte ein Referenz-Design für eine 3D-Soundbar vorstellen, mit der es möglich ist, raumfüllenden Klang mit nur einer Soundbar, die unterhalb des Fernsehers auf­gestellt wird, wiederzugeben. Der Kauf von zahlreichen Lautsprechern und die aufwendige Verkabelung sind nicht mehr notwendig – eine Soundbar reicht aus, um den Mittendrinklang nach Hause zu bringen.

MPEG-H Audio ist nicht auf den Einsatz in Fernsehern beschränkt. Im Gegenteil: Der Codec wurde so entwickelt, dass die Wiedergabe dynamisch auf das jeweilige Endgerät angepasst wird. Es ist also egal, ob man mit Smartphone, Tablet, Fernseher mit eingebauten Lautsprechern, Soundbar oder einem ausgewachsenen Heimkinosystem Inhalte wiedergibt. Die Klangqualität wird für die jeweilige Abspielsituation optimiert.

Damit erfüllt MPEG-H Audio alle Anforderungen an einen modernen Audiocodec. Die An­wendung innerhalb geschlossener Systeme von Streaming-Anbietern ist sofort möglich. Für den Einsatz im TV muss der Codec dagegen in Anwendungsstandards wie ATSC oder DVB integriert werden. Auch hier war unser Audio-Team aktiv und konnte erreichen, dass MPEG­-H Audio sowohl in den ATSC 3.0- als auch in den DVB-Standard integriert wurde. Werden also künftig in Ländern weltweit neue TV-Systeme eingeführt, z. B. für die Übertragung von ultrahochauflösendem 4K-Video (UHD), steht MPEG-H Audio für die Audioübertragung zur Verfügung.

UHDTV in Südkorea mit MPEG-H Audio

Aktuelles Beispiel für eine solche Einführung ist das neue UHDTV-System in Südkorea, das für die Audioübertragung MPEG-H Audio nutzen wird. Das auf dem Standard ATSC 3.0 basierende System wird zunächst in Seoul und Umgebung starten. Bis zu den Olympischen Winterspielen 2018 soll es auf die Sportstätten ausgeweitet und bis 2021 in der gesamten Republik Korea eingeführt sein. MPEG-H Audio ist der erste Audiocodec der neuen Gene­ration, der in einem terrestrischen 4K-System zum Einsatz kommen wird. Südkorea ist hier wieder einmal technischer Vorreiter.

Auch bei Entwicklung und Vermarktung von Sende- und Empfangsgeräten mit MPEG-H­ Audio-Unterstützung sind südkoreanische Firmen unter den frühen Anbietern. So wurden die ersten TV-Encoder von den koreanischen Firmen Kai Media, DS Broadcast und Pixtree angekündigt bzw. auf den Markt gebracht. Die Encoder werden von den Sendeanstalten benötigt, um das produzierte Programm vor der Ausstrahlung zu encodieren und damit für die Ausstrahlung vorzubereiten. Auch eine deutsche Firma bietet bereits professionelles Equipment an: Mit der MPEG-H Audio Monitoring and Authoring Unit von Jünger Audio aus Berlin lässt sich einhüllender, interaktiver Klang auch bei Live-Veranstaltungen mischen und für die Übertragung aufbereiten. Schließlich werden rechtzeitig zur Einführung von MPEG-H Audio in Südkorea Plug-in und Software-Werkzeuge auf den Markt kommen, die es Tonmeistern und Sounddesignern erlauben, in ihrer bevorzugten Arbeitsumgebung MPEG-H­ Audio-Ton zu mischen. Auf der Empfangsseite bringen führende Unterhaltungselektronik­hersteller TV-Geräte mit MPEG-H Audio auf den Markt. Damit ist alles vorbereitet für die Einführung von interaktivem 3D-Sound in Südkorea: Der Codec sorgt für einhüllenden Klang bei niedrigen Datenraten, den TV-Sendern steht das notwendige Equipment zur Verfügung und die Endverbraucher können Fernseher kaufen, um das neue Programm wiederzugeben.

Erste Tests auch in Deutschland

Bei deutschen TV-Sendern gibt es ebenfalls Interesse an den neuen Möglichkeiten, die Interaktivität, 3D-Sound und MPEG-H Audio bieten. So haben unsere Tonmeister das ZDF bei der Aufnahme und Abmischung von 3D-Sound für die »Terra X«-Folge »Wolfskinder« unterstützt. In dieser außergewöhnlichen Produktion wurden neue Technologien für die Aufnahme und Verbreitung von Bild und Ton getestet. Dafür wurde in 4K-Auflösung gedreht und 360-Grad-Videos aufgenommen, um sie parallel zur TV-Aussendung im Internet anzu­bieten. Insbesondere für die 360-Grad-Videos ist der 3D-Sound von zentraler Bedeutung.

Bis zur Einführung eines terrestrischen 4K-TV-Systems in Deutschland wird es sicherlich noch etliche Jahre dauern. MPEG-H Audio steht dann aber bereit, da es in der DVB-Spezifikation enthalten ist und damit in allen DVB-basierten Systemen eingesetzt werden kann. Und das gilt natürlich nicht nur für Deutschland: Länder rund um den Globus werden künftig ultra­ hochauflösendes Fernsehen einführen – und immer wird MPEG-H Audio auch eine Option für den perfekten Ton sein.


Hinweis: Mit dem Starten des Videos werden Daten an youtube übertragen.