MPEG-H Audio

Next generation audio

© Photo Fraunhofer IIS/Viaframe
© Fraunhofer IIS/Viaframe

Interaktiver, umhüllender 3D-Klang für TV, Streaming und VR

 

Umhüllender, personalisierter Klang

Neben realistischem Raumklang bietet das MPEG-H Audio-System seinen Nutzern die Möglichkeit zwischen verschiedenen voreingestellten Audiomixes zu wählen bzw. die Dialog-Lautstärke entsprechend der eigenen Präferenzen zu beeinflussen.

 

Auf jedem Endgerät verfügbar

Ob im Heimkino, auf dem Smartphone oder der VR-Brille – MPEG-H Audio liefert stets unabhängig vom Endgerät das beste Hörerlebnis.

 

Eine Technologie für alle Anwendungen

MPEG-H Audio wurde sowohl für den Einsatz in Streaming-Anwendungen als auch für derzeitige und zukünftige Rundfunksysteme entwickelt.

 

Der offene Audiostandard der nächsten Generation

Aufgrund einer fairen Preiskalkulation und einer umfangreichen Entwickler-Gemeinschaft, die auf offene Standards spezialisiert ist, kann MPEG-H Audio auf unkomplizierte und transparente Weise bezogen werden. So steht auch der schnellen Entwicklung eines kompletten Endgeräte-Ökosystems für professionelle Anwender und Endnutzer nichts im Weg.

 

Universell einsetzbar

Das MPEG-H Audiosystem wurde eigens für die Integration in Streaming- und Rundfunk-Infrastrukturen konstruiert. Die 3D-Audiobestandteile können dabei über jede Lautsprecher-Konfiguration oder über Stereo-Kopfhörer wiedergegeben werden.

 

Verbesserte Barrierefreiheit durch Personalisierung

Dank der Personalisierungsmöglichkeiten von MPEG-H Audio kann man die Dialoglautstärke anheben und die Audiodeskription an die eigenen Wünsche anpassen. Dadurch wird ein auf die individuellen Bedürfnisse zugeschnittener Medienkonsum ermöglicht.

Das Fraunhofer IIS arbeitet daran, die Produktion von personalisierbaren Inhalten zu vereinfachen, damit Rundfunkanstalten ihr Angebot an barrierefreien Inhalten erweitern können. Unser Algorithmus zur Dialogtrennung erlaubt es, die Dialoglautstärke auch in konventionellem Filmmaterial, in dem keine einzelnen Tonspuren vorhanden sind, anzupassen. Methoden zur Erstellung von automatischen Audiomischungen können helfen, die Produktion von Audiodeskription zu erleichtern, um diese beispielsweise auch bei Low-Budget-Produktionen oder bei kurzfristigen Produktionen anbieten zu können. Rundfunkanstalten können dank der MPEG-H Audio-Metadaten genau kontrollieren, welche Einstellungsmöglichkeiten sie ihren Nutzern anbieten möchten.

Immersives Musik-Streaming

Das 3D-Audioformat 360 Reality Audio basiert auf dem offenen Standard MPEG-H. Das neue Format, welches von Sony ins Leben gerufen wurde, ermöglicht es Musikern und Künstlern, ein 360 Grad-Klangfeld zu kreieren, in dem Gesang, Chor und Instrumente überall platziert werden können. Wenn die Hörer diesen Inhalt abspielen, können sie ein Musikerlebnis genießen, das sie komplett in den Klang einhüllt und die Musik so hören, wie der Künstler es bei der Produktion vorgesehen hat.

Erste 360 Reality Audio Musik-Streamingdienste werden von Amazon Music HD, Deezer, nugs.net und Tidal noch in diesem Jahr angeboten werden. Um den neuen Klang zu genießen, können Endanwender als erstes Wiedergabegerät den Amazon Echo High-End Smartspeaker nutzen. Will man 360 Reality Audio Inhalte über Kopfhörer auf mobilen Android/iOS Geräten hören, muss auf dem jeweiligen Gerät die App eines unterstützenden Streamingdienstes installiert sein.

Einen Prototypen für immersive Musikwiedergabe im Auto haben das Fraunhofer IIS, Sony und Audi gemeinsam auf der 2019 AES International Conference on Automotive Audio im September vorgestellt. Die einhüllende Lieblingsmusik auf 3D-Audio-fähigen Geräten mobil, zu Hause oder im Auto zu hören, eröffnet Nutzern ein nahtloses, immersives Musikvergnügen.

Das Fraunhofer IIS bietet Endgeräteherstellern 360 Reality Audio kompatible MPEG-H Decoder an.

Audio für TV und Streaming

Das interaktive Fraunhofer 3D-Audio-System für TV und Streaming – basierend auf dem MPEG-H Audio Standard

 

Interaktivität ermöglicht personalisierte Hörerlebnisse

Die Interaktivität von MPEG-H Audio basiert auf der Codierung von Audioobjekten und erlaubt es Zuschauern, den Audiomix ihres Fernsehprogramms an ihre Präferenzen anzupassen. So können beispielsweise schwer verständliche Dialoge lauter gestellt werden. Weitere Möglichkeiten sind die Übertragung von Audiodeskriptionen (für blinde und sehbehinderte Menschen) oder mehrere zusätzliche Sprachen. Dabei sind nur 20 bis 40 kbit/s pro Sprache an zusätzlichen Daten nötig.

Nicht nur im Kino zu hören: Raumklang fürs Wohnzimmer

Die Übertragung von 3D-Klang mit MPEG-H Audio ist auf verschiedene Arten umsetzbar: Etwa durch die Ergänzung weiterer Front- und Höhenlautsprecher oder mit Hilfe der Klangfeld-Technologie Higher-Order-Ambisonics. So werden Surround Sound-Übertragungen deutlich verbessert. Ihr Klang ist realistischer und vergleichbar mit Hörerlebnissen im Kino.

Zukünftig kann die 3D-Audio-Wiedergabe auch über Soundbars erfolgen. Das Fraunhofer IIS hat selbst einen entsprechenden Prototypen entwickelt. So soll hochwertiger Raumklang für ein breiteres Publikum zugänglich gemacht werden, ohne dass die Installation zusätzlicher Lautsprecher nötig ist.

Beispiellose Codier-Effizienz

Die Kombination des MPEG-H Audiocodecs mit weiteren neuartigen Audiotechnologien ermöglicht den Transport von Audioobjekten oder zusätzlichen Kanäle für 3D-Klang bei Bitraten, die heute typischerweise für 5.1 Surround-Übertragungen benötigt werden.

Bitraten in  kbit/s Gut Empfohlen Transparent
22.2 Kanäle 384 512 1200

7.1 + 4 Höhenlautsprecher

+ 4 Objekte

200 384 800
5.1 Kanäle 96 160 256
2.0 Kanäle 48
56 160

 

 

Internetfähig und für jedes Endgerät geeignet

Neben der Unterstützung von DASH für eine unterbrechungsfreie Übertragung bietet das Audiosystem I-frames, die den Wechsel zwischen DASH-Bitströmen erleichtern, sowie Splicing, um Werbeblöcke problemlos einzufügen. Die integrierte Lautheitskontrolle ist für verschiedenste Plattformen geeignet und ermöglicht so unabhängig von Umgebung und Endgerät ein auf den Zuschauer zugeschnittenes Hörerlebnis.

 

Überzeugender Klang – unabhängig der Lautsprecheraufstellung

Integrierte Rendering-Technologien ermöglichen die Wiedergabe aller Audioformate auf allen existierenden Lautsprecherkonfigurationen. Selbst wenn Lautsprecher aufgrund der Wohnzimmerform oder –größe nicht richtig platziert werden können, hat das keinen negativen Einfluss auf den Klang. Die verbesserte Downmix-Funktion erlaubt darüber hinaus sogar für 5.1- und Stereo-Konfigurationen eine eingeschränkte Wiedergabe von Höheninformationen.

Virtuelle Realität

Virtual Reality Erfahrung mit Fraunhofer Cingo
© Fraunhofer IIS/David Hartfiel

MPEG-H Audio ermöglicht ein Hörerlebnis, das weit über Surround Sound hinausgeht. Dabei wird umhüllender 3D-Klang mithilfe zusätzlicher Höheninformation erzeugt.

Dank seiner hohen Codiereffizienz ist MPEG-H Audio nicht nur die erste Wahl für TV sondern auch für VR-Streaming-Anwendungen. So kann 3D-Klang bereits bei nur 200 kbit/s übertragen werden.

MPEG-H Audio kann innerhalb eines einzelnen Bitstroms Audiokanäle, -objekte und Ambisonic-Signale sowie Audiometadaten transportieren.

Während sich Audiokanäle besonders für die Übertragung von Rundumklang eignen, helfen dynamische Audioobjekte dabei, Nutzer durch 360º-Stories zu führen. Sie ermöglichen die präzise Positionierung von Klangereignissen um den Kopf des Hörers herum. Dabei können spezifische Abstände zum Ohr festgelegt werden. Mit Ambisonics-Signalen werden ganze Audioszenen aufgenommen. Sie erleichtern sowohl die Manipulation des Blickwinkels als auch die Umsetzung von Kopfrotationen bei der Wiedergabe.

Standards

Lizenzanfrage: MPEG-H Audio

Bitte füllen Sie für weitere Fragen zur Technologie und ihrer Lizenzierung das Formular aus und schicken Sie es dann ab.

* Required

Für welche Art der Lizenz interessieren Sie sich?
Software-Plattform
Hardware-Plattform
Anrede
Name