IVAS

关于IVAS

沉浸式语音和音频服务 (IVAS) 是全新的基于 EVS 的通信编解码器,目前正在由3GPP进行标准化工作。它可以在诸如电话会议和视频会议等应用场景中实现逼真的空间声学体验。作为对话式立体声和沉浸式编解码器,它可以处理不同对话场景下各种麦克风配置捕获的信号。就像 EVS 一样,IVAS 是一种移动通信编解码器,因此可以在低至 13.2 或 24.4 kbit/s 的比特率下运行,并且保持极低延迟。

打造栩栩如生的沟通体验

© Photo Syda Productions - stock.adobe.com

随着沉浸式 VR 体验变得越来越普遍,通信行业同样面临着用户对于逼真体验的需求。这不仅适用于个人市场,也适用于商业环境。传统的语音服务通常仅限于单声道音频的传输与还放,这使得在通话中很难区分多个说话者,并在与视频结合时导致说话者定位出现差异,并经常产生听众疲劳。沉浸式音频技术(如 IVAS)可以更轻松地在视频通话和其他虚拟会议期间跟踪多个参与者的对话,并区分人声与背景声。

一项关于虚拟现实对 3GPP 服务影响的研究表明,人们期待通信应用变得更加栩栩如生。这也促成了沉浸式通信编解码器的工作项目。Fraunhofer IIS 目前正在积极参与 IVAS 的开发。

IVAS赋能多维沟通

IVAS 将推动通信领域的最新发展并使现实会议成为可能。为了使其成为大多数设置的可行选择,它支持立体编码和渲染,这也是空间会议和 VR 的最低要求。

但它并不止于此:IVAS 将支持真正沉浸式格式的编码和渲染,例如音频对象、Ambisonics 和多声道音频。它旨在与通常用于通信的麦克风配合使用,例如手机或平板电脑等 5G 移动设备和各种静态麦克风设置或阵列。结合其灵活渲染功能,IVAS 将能够在各种扬声器配置上播放这些内容,无论是在电脑、汽车、客厅,还是通过耳机进行双耳渲染。

© Photo Sennheiser/Max Threlfall