发明名称 |
基于听觉场景分析及语音模型化的语音信号分离及合成 |
摘要 |
本发明提供用于从表示噪声与语音的混合物的语音信号产生清晰语音的系统及方法。所述清晰语音可由合成语音参数产生。所述合成语音参数是基于语音信号分量以及语音模型使用听觉与语音产生原理而导出。模型化可利用所述语音信号的声源滤波器结构。执行对所述语音信号的一或多次频谱分析以产生频谱表示。基于频谱表示导出特征数据。根据语音模型,将对应于目标语音的特征进行分组且使其与所述特征数据分离。包含频谱包络、音高数据及声音分类数据的所述合成语音参数是基于对应于所述目标语音的特征而产生。 |
申请公布号 |
CN105474311A |
申请公布日期 |
2016.04.06 |
申请号 |
CN201480045547.1 |
申请日期 |
2014.07.21 |
申请人 |
视听公司 |
发明人 |
C·阿文达尼奥;D·克莱恩;J·伍德拉夫;M·古德温 |
分类号 |
G10L21/0208(2006.01)I |
主分类号 |
G10L21/0208(2006.01)I |
代理机构 |
北京律盟知识产权代理有限责任公司 11287 |
代理人 |
林斯凯 |
主权项 |
一种用于从噪声与语音的混合物产生清晰语音的方法,所述方法包括:基于噪声与语音的所述混合物及语音模型导出语音参数,所述导出是使用至少一个硬件处理器而进行;及至少部分基于所述语音参数合成清晰语音。 |
地址 |
美国加利福尼亚州 |