发明名称 一种语音检测方法
摘要 一种语音检测方法,在传统的语音传感器的附近设置一个视频传感器,在语音传感器接收到信号特征的同时,视频传感器接收视频信号特征,并通过训练过程得到视频数据和语音/非语音数据之间的联系,再通过应用过程,根据输入的视频信号计算输入的信号特征是否为语音信号。本发明语音检测方法可很大程度避免检测器不能正确检测语音和非语音信号,使语音检测的正确率大大提高。
申请公布号 CN101656070B 申请公布日期 2012.01.04
申请号 CN200810041965.X 申请日期 2008.08.22
申请人 展讯通信(上海)有限公司 发明人 黄鹤云;林福辉
分类号 G10L11/02(2006.01)I 主分类号 G10L11/02(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 骆苏华
主权项 一种语音检测方法,其特征在于:在传统的语音传感器的附近设置一个视频传感器,在语音传感器接收到信号特征的同时,视频传感器接收视频信号特征,并通过训练过程得到视频数据和语音/非语音数据之间的联系,再通过应用过程,根据输入的视频信号计算输入的信号特征是否为语音信号;所述训练过程和应用过程包括以下步骤:步骤一:从已知的训练的语音和非语音的数据及其相应的视频数据挖掘视频数据和语音/非语音类别间的概率关系,假设已知的被标签过的语音和非语音的概率是p,视频数据或者其变换数据为x;步骤二:根据被标签的数据,将数据集合分成语音和非语音的数据,在每个子数据集合用数据计算其概率分布的模型;步骤三:根据步骤二训练得出的概率模型,以及输入的视频信号数据x计算其为语音或者非语音的概率p;步骤四:根据步骤三计算出的概率,判断当前输入信号是不是语音信号。
地址 201203 上海市浦东张江祖冲之路2288弄展讯中心1号楼