发明名称 Statistical Model-based Voice Activity Detection with Ensemble of Deep Neural Network Using Acoustic Environment Classification and Voice Activity Detection Method thereof
摘要 음향 환경 분류를 이용한 심화신경망의 앙상블이 구성된 통계모델 기반의 음성 검출 장치 및 음성 검출 방법이 제시된다. 음향 환경 분류를 이용한 심화신경망의 앙상블이 구성된 통계모델 기반의 음성 검출 방법에 있어서, 분류 단계에서, 입력되는 잡음환경에 의해 오염된 음성 신호로부터 특징 벡터를 추출하고 미리 학습된 각 심화신경망을 통과시켜 음성존재확률을 각각 추정하는 단계; 및 상기 분류 단계에서, 각각의 학습된 상기 심화신경망을 통해서 추정된 상기 음성존재확률을 합성하기 위하여 음향환경인지 기술을 적용하여 최종적인 음성존재확률을 결정하고, 상기 입력된 음성 신호를 음성 구간 또는 비음성 구간으로 분류하는 단계를 포함할 수 있다.
申请公布号 KR101704926(B1) 申请公布日期 2017.02.23
申请号 KR20150148297 申请日期 2015.10.23
申请人 한양대학교 산학협력단 发明人 황인영;장준혁
分类号 G10L15/16;G10L15/06;G10L15/28;G10L25/78 主分类号 G10L15/16
代理机构 代理人
主权项
地址