MPEG-H Audio

Next Generation Audio

Interaktiver, umhüllender 3D-Klang für TV, Streaming und VR

MPEG-H Audio ist eine Audiotechnologie der nächsten Generation, die mehr Realismus bietet, indem die zuhörende Person rundherum in Klang gehüllt wird. Mit seinen einzigartigen Personalisierungsfunktionen bietet MPEG-H Audio dem Publikum eine große Flexibilität, um sich aktiv mit den Inhalten auseinanderzusetzen und sie an ihre eigenen Vorlieben anzupassen. Unabhängig vom Gerät bietet das MPEG-H Audio-System das bestmögliche Klangerlebnis.

Es ist Teil der ATSC, DVB, TTA (koreanisches Fernsehen) und SBTVD (brasilianisches Fernsehen) Standards sowie das alleinige Audiosystem des weltweit ersten terrestrischen UHD-Fernsehservice in Südkorea. Das System wurde im Standard ATSC 3.0 im Mai 2017 in Betrieb genommen. In Brasilien ist es das einzige verpflichtende Audiosystem des Next Generation TV 3.0 Rundfunkservice, der voraussichtlich ab 2024 zum Einsatz kommen soll.

© Fraunhofer IIS
Verschiedene Wahlmöglichkeiten bei Sportübertragungen: mehrere Kommentare zum Beispiel für Heim- und Auswärtsmannschaft, Stadionklang als wäre man live bei der Veranstaltung.

© Fraunhofer IIS
MPEG-H überall genießen: unterwegs, im Wohnzimmer, im Auto - eine Produktion bzw. ein Stream liefert auf allen Geräten immer das bestmögliche Klangerlebnis.

© Fraunhofer IIS
Das MPEG-H Audio-System wurde eigens für die Integration in Streaming- und Rundfunk-Infrastrukturen konstruiert. Die 3D-Audiobestandteile können dabei über jede Lautsprecher-Konfiguration, über Stereo-Kopfhörer oder mit MPEG-H-fähigen Soundbars wiedergegeben werden.

Umhüllender und personalisierter Klang

Neben realistischem Raumklang bietet das MPEG-H Audio-System die Möglichkeit zwischen verschiedenen voreingestellten Audiomixes zu wählen bzw. die Dialog-Lautstärke entsprechend der eigenen Präferenzen zu beeinflussen.

Auf jedem Endgerät verfügbar

Unabhängig vom Endgerät bietet das MPEG-H Audio-System das beste Hörerlebnis - ob im Heimkino, auf den Smartphones, auf den Tablets oder auf den VR-Geräten.

Eine Technologie für alle Anwendungen

MPEG-H Audio wurde sowohl für den Einsatz in Streaming-Anwendungen als auch für derzeitige und zukünftige Rundfunksysteme - vom Beitrag zur Emission - entwickelt. Die immersiven Klangfunktionen können über jede Lautsprecherkonfiguration oder über Kopfhörer wiedergegeben werden.

Der offene Audiostandard der nächsten Generation

Aufgrund einer fairen Preiskalkulation und einer umfangreichen Entwickelnden-Gemeinschaft, die auf offene Standards spezialisiert ist, kann MPEG-H Audio auf unkomplizierte und transparente Weise bezogen werden. So steht auch der schnellen Entwicklung eines kompletten Endgeräte-Ökosystems für professionelle Anwendende und Endnutzende nichts im Weg.

Verbesserte Barrierefreiheit durch Personalisierung

Dank der Personalisierungsmöglichkeiten von MPEG-H Audio kann man die Dialoglautstärke anheben und die Audiodeskription an die eigenen Wünsche anpassen. Dadurch wird ein auf die individuellen Bedürfnisse zugeschnittener Medienkonsum ermöglicht.

Das Fraunhofer IIS arbeitet daran, die Produktion von personalisierbaren Inhalten zu vereinfachen, damit Rundfunkanstalten ihr Angebot an barrierefreien Inhalten erweitern können. Unser Dialog+ Algorithmus zur Dialogtrennung erlaubt es, die Dialoglautstärke auch in konventionellem Filmmaterial, in dem keine einzelnen Tonspuren vorhanden sind, anzupassen. Methoden zur Erstellung von automatischen Audiomischungen können helfen, die Produktion von Audiodeskription zu erleichtern, um diese beispielsweise auch bei Low-Budget-Produktionen oder bei kurzfristigen Produktionen anbieten zu können. Rundfunkanstalten können dank der MPEG-H Audio-Metadaten genau kontrollieren, welche Einstellungsmöglichkeiten sie ihren Nutzenden anbieten möchten.

Native Unterstützung offener Produktionsformate

Das MPEG-H Audio-System kann Audioinhalte der nächsten Generation mithilfe des Audio Definition Model (ADM) gemäß ITU-R BS.2076 oder des Immersive Audio Bitstream (IAB) gemäß SMPTE ST 2098-2 verarbeiten. Das MPEG-H ADM Profil bietet native Interoperabilität mit Produktions- und Distributionssystemen für MPEG-H Audio in Echtzeit- und Postproduktions-Workflows. Das MPEG-H Info Tool ermöglicht automatisierte Konformitätstests von ADM-basierten Inhalten hinsichtlich ADM-Profilen, welche vom MPEG-H Audio-System unterstützt werden.

Immersives Musik-Streaming

Das 3D-Audioformat 360 Reality Audio basiert auf dem offenen Standard MPEG-H. Das neue Format, welches von Sony ins Leben gerufen wurde, ermöglicht es Musizierenden und Kunstschaffenden, ein 360 Grad-Klangfeld zu kreieren, in dem Gesang, Chor und Instrumente überall platziert werden können. Wenn die zuhörenden Personen diesen Inhalt abspielen, können sie ein Musikerlebnis genießen, das sie komplett in den Klang einhüllt und die Musik so hören, wie der Kunstschaffende es bei der Produktion vorgesehen hat.

Erste 360 Reality Audio Musik-Streamingdienste von Amazon Music HD, Deezer, Sony Select, nugs.net und Tidal starteten im Herbst 2019. Mittlerweile werden mehr als 3000 Songs von großen Labels wie Sony Music, Universal Music und Warner Music sowie Live-Konzerte von Live Nation angeboten. Um den neuen Klang zu genießen, können Endnutzende als erstes Wiedergabegerät den Amazon Echo High-End Smartspeaker nutzen. Will man 360 Reality Audioinhalte über Kopfhörer auf mobilen Android/iOS Geräten hören, muss auf dem jeweiligen Gerät die App eines unterstützenden Streamingdienstes installiert sein.

Einen Prototypen für immersive Musikwiedergabe im Auto haben das Fraunhofer IIS, Sony und Audi gemeinsam auf der 2019 AES International Conference on Automotive Audio im September vorgestellt. Die einhüllende Lieblingsmusik auf 3D-Audio-fähigen Geräten mobil, zu Hause oder im Auto zu hören, eröffnet Nutzenden ein nahtloses, immersives Musikvergnügen.

Das Fraunhofer IIS bietet Endgeräte Herstellfirmen 360 Reality Audio kompatible MPEG-H Decoder an.

Erfahren Sie mehr über das neuartige Musikerlebnis (audioblog.iis.fraunhofer.com)

Audio für TV und Streaming

Das interaktive Fraunhofer 3D-Audio-System für TV und Streaming – basierend auf dem MPEG-H Audio Standard

Interaktivität ermöglicht personalisierte Hörerlebnisse

Die Interaktivität von MPEG-H Audio basiert auf der Codierung von Audioobjekten und erlaubt es dem Publikum, den Audiomix ihres Fernsehprogramms an ihre Präferenzen anzupassen. So können beispielsweise schwer verständliche Dialoge lauter gestellt werden. Weitere Möglichkeiten sind die Übertragung von Audiodeskriptionen (für blinde und sehbehinderte Menschen) oder mehrere zusätzliche Sprachen. Dabei sind nur 20 bis 40 kbit/s pro Sprache an zusätzlichen Daten nötig.

Nicht nur im Kino zu hören: Raumklang fürs Wohnzimmer

Die Übertragung von 3D-Klang mit MPEG-H Audio ist auf verschiedene Arten umsetzbar: Etwa durch die Ergänzung weiterer Front- und Höhenlautsprecher oder mit Hilfe der Klangfeld-Technologie Higher-Order-Ambisonics. So werden Surround Sound-Übertragungen deutlich verbessert. Ihr Klang ist realistischer und vergleichbar mit Hörerlebnissen im Kino.

Zukünftig kann die 3D-Audio-Wiedergabe auch über Soundbars erfolgen. Das Fraunhofer IIS hat selbst einen entsprechenden Prototypen entwickelt. So soll hochwertiger Raumklang für ein breiteres Publikum zugänglich gemacht werden, ohne dass die Installation zusätzlicher Lautsprecher nötig ist.

Internetfähig und für jedes Endgerät geeignet

Neben der Unterstützung von DASH für eine unterbrechungsfreie Übertragung bietet das Audiosystem I-frames, die den Wechsel zwischen DASH-Bitströmen erleichtern, sowie Splicing, um Werbeblöcke problemlos einzufügen. Die integrierte Lautheitskontrolle ist für verschiedenste Plattformen geeignet und ermöglicht so unabhängig von Umgebung und Endgerät ein auf das Publikum zugeschnittenes Hörerlebnis.

Überzeugender Klang – unabhängig der Lautsprecheraufstellung

Integrierte Rendering-Technologien ermöglichen die Wiedergabe aller Audioformate auf allen existierenden Lautsprecherkonfigurationen. Selbst wenn Lautsprecher aufgrund der Wohnzimmerform oder –größe nicht richtig platziert werden können, hat das keinen negativen Einfluss auf den Klang. Die verbesserte Downmix-Funktion erlaubt darüber hinaus sogar für 5.1- und Stereo-Konfigurationen eine eingeschränkte Wiedergabe von Höheninformationen.

Standards

ATSC: A/342 Part 3:2017, MPEG-H System

Digital Video Broadcasting (DVB): Specification for the use of Video and Audio Coding in Broadcasting Applications based on the MPEG-2 Transport Stream

Digital Video Broadcasting (DVB): EN 300 468 (A038 10/2016), Specification for Service Information (SI) in DVB systems

HbbTV: HbbTV 2.0.2 Specification

TTA: Transmission and Reception for Terrestrial UHDTV Broadcasting Service

SCTE: SCTE 242-3, Next Generation Audio Coding Constraints for Cable Systems: Part 3 - MPEG-H Audio Coding Constraints (request for paper)

SCTE: SCTE 243-3, Next Generation Audio Coding Constraints for Cable Systems: Part 3 - Carriage of MPEG-H Audio (request for paper)

CTA: CTA-CEB-32.5, Recommended Practice for ATSC 3.0 Television Sets, Audio

CTA: CTA-5001, Web Application Video Ecosystem – Content Specification

DASH-IF: Guidelines for Implementation: DASH-IF Interoperability Point for ATSC 3.0

VR-IF: VR Industry Forum Guidelines

UHD Forum: Ultra HD Forum Phase B Guidelines, Revision: 1.0

Weitere Informationen

News

Alle Neuigkeiten zu MPEG-H Audio finden Sie in unserem Fraunhofer Audio Blog (audioblog.iis.fraunhofer.com)

Produktbroschüre

MPEG-H Audio: The next-generation system for interactive and immersive sound [ PDF 2.59 MB ]

Paper

Implementierung von Audiocodecs

Erhalten Sie weitere Informationen zu unseren Cloud Development Kits (CDKs) und Software Development Kits (SDKs).

Audio Implementierungen

Videos (auf Youtube)

Virtual Showroom

Zur Demo