Fraunhofer upHear 보이스 음질 개선 기술

개요

Fraunhofer upHear 보이스 음질 개선 기술은 스마트 홈 기기들(스마트폰, 스마트스피커)의 내장마이크를 이용, 사람의 음성을 디바이스가 더욱 명확하게 인지할 수 있도록 설계되었습니다.

 

문제점

컴퓨터가 학습할 수 있도록 하는 알고리즘 기술이 발전함에 따라 HMI(Human Machine Interfaces, 음성을 통한 학습 알고리즘)는 스마트폰, 스마트 홈 기기, 자동차 등 여러 분야에 적용되고 있습니다. HMI 음성제어 기술은 다음과 같은 기술적 요소를 갖추고 있습니다.

  • 시스템을 깨우는(wake-up) 핵심어 검출(keyword-spotter) 기술
  • 음성을 텍스트로 변환하는 자동 음성 인식 모듈 (Automatic Speech Recognizer, ASR)
  • 기계와의 자연스러운 대화를 위한 자연어 이해 인터페이스 (Natural Language understanding interface, NLUI)
  • 사용자에게 의미 있는 피드백 명령을 생산하는 자연어 생성(Natural Language Generation, NLG)
  • 텍스트에서 합성된 음성을 생성하는 문자음성 자동변환 모듈 (Text-To-Speech, TTS)

음성 제어 HMI의 입력은 기기의 내장 마이크로 수음(受音)된 오디오 스트림입니다. 특히 핵심어 검출 기술 및 ASR 성능은 수음된 음성의 음질에 직접적으로 영향을 받습니다.

Fraunhofer upHear 보이스 음질 개선 기술은 기기의 마이크가 수음한 불필요한 사운드를 삭제하면서 사용자의 음성을 추출하며 HMI가 사용자의 요청을 이해하는 데 방해가 되는 음향학적 반향을 제거합니다.

 

솔루션

Fraunhofer upHear 보이스 음질 개선 기술은 울림 및 잡음 감소 알고리즘을 포함한 고급 멀티채널 소스정위(Localization) 및 빔포밍(beam forming) 기술을 포함한 유연하면서도 완벽한 통합 솔루션 입니다. 또한, 좋지 않은 음향상태에서도 탁월한 음질을 제공합니다. 진보된 어쿠스틱 반향 제거 기능은 HMI 명령어 대기 중 상태에서 ‘바지인(barge-in)’ 기능을 가능케 합니다.

하나(single)의 마이크를 위해 지원되는 기술이지만, 원거리에서도 사용자의 음성을 용이하게 인식할 수 있는 다양한 마이크 어레이(Mircrophone arrays) 사용을 추천합니다.

디바이스 튜닝 및 마이크(Microphone) 위치에 관한 전문가 컨설팅이 필요할 경우 당사에 문의 주십시오.

제품 특징

Fraunhofer upHear 보이스 음질 개선 기술은 다음과 같은 최적화된 기능들을 통해 음성 품질을 향상시킵니다.

  • 음향 반향 삭제 (Acoustic Echo Cancellation, AEC) 장치의 스피커에서 발생한 에코를 감소시킵니다.
  • 음원 위치 추적 (Direction of arrival, DOA)화자의 방향을 추정합니다.
  • 빔포밍 (Beamforming) 마이크 어레이에 의한 공간적 다양성을 이용하여 지향성 음향 수집 및 원거리의 사용자 음성을 추출합니다.
  • 잡음 제거 (Noise Reduction, NR), 탈반향(dereverberation) 및 자동 이득 제어(Automatic Gain Control, AGC) 수음된 음성의 품질을 더욱 향상시킵니다.

제품 요구사항

Fraunhofer upHear 보이스 음질 개선 기술은기기의 형태 및 마이크 배열 등에 최적화 될 수 있습니다. 이는 제품 디자인의 유연성과 최적의 성능을 보장합니다. 선형 또는 원형 마이크 배치와 같은 일반적으로 사용되는 마이크 어레이 구조가 기본적으로 지원됩니다.

다채널을 위한 마이크 수와 배열들은 애플리케이션 시나리오 및 제품 디자인에 따라 다릅니다. Fraunhofer upHear 보이스 음질 개선 기술은 마이크가 2개, 4개 혹은 8개까지 탑재된 기기들을 지원할 수 있습니다. 아래의 그래픽은 단순한 예시입니다.

가용성

Fraunhofer upHear 보이스 음질 향상 기술은 라이센스로 제공됩니다. 소프트웨어 라이브러리는 다음과 같은 프로그램에 제공될 수 있습니다.

  • 데스크톱 플랫폼 (Windows, Mac, Linux)
  • 모바일 앱 (iOS, Android)
  • 임베디드 시스템 (예시: ARM Corex)

 

라이센스 소프트웨어에 대한 문의가 있으신 경우 아래의 형식에 따라 요청양식을 작성해 주십시오.

Request licensing information: upHear Voice Quality Enhancement

To request a price quote or an evaluation license, please fill in and submit the form.

* Required

Software platform:
Hardware platform
Title
Name