发明名称 |
VOICE SECTION DETECTION DEVICE, SPEECH RECOGNITION DEVICE, METHOD THEREOF, AND PROGRAM |
摘要 |
【課題】実環境下における単一マイクへの複数話者混入音声に対し、静音環境下のみならず、高雑音環境下でも高い精度で主話者音声の認識を行うことができる音声区間検出技術を提供する。【解決手段】音声区間検出装置10は、音声モデルを用いて、音声と雑音と残響とを含む音声ディジタル信号に含まれる雑音を抑圧して雑音抑圧音声ディジタル信号を求める雑音抑圧部110と、雑音抑圧音声ディジタル信号に含まれる残響成分を推定して残響信号を求める残響推定部120と、雑音抑圧音声ディジタル信号と残響信号との差である雑音残響抑圧音声ディジタル信号を求める主話者音声特徴強調部140と、音声モデルを用いて、雑音残響抑圧音声ディジタル信号から主話者が話している区間である主話者音声区間を識別する主話者識別部150を含む。【選択図】図1 |
申请公布号 |
JP2015155982(A) |
申请公布日期 |
2015.08.27 |
申请号 |
JP20140031276 |
申请日期 |
2014.02.21 |
申请人 |
NIPPON TELEGR & TELEPH CORP <NTT> |
发明人 |
KAMADO NORIYOSHI;FUJIMOTO MASAKIYO;KINOSHITA KEISUKE;AONO YUJI |
分类号 |
G10L15/04;G10L15/20;G10L21/0272 |
主分类号 |
G10L15/04 |
代理机构 |
|
代理人 |
|
主权项 |
|
地址 |
|