发明名称 用于确定语音/非语音的装置和方法
摘要 第一存储单元存储变换矩阵,以及第二存储单元存储语音模型和非语音模型。划分单元将声信号划分成多个帧。提取单元从所述帧的声信号提取特征向量,变换单元对该特征向量进行线性变换,以及确定单元确定所述帧中的特定帧是语音帧还是非语音帧。
申请公布号 CN1953050A 申请公布日期 2007.04.25
申请号 CN200610144760.5 申请日期 2006.10.19
申请人 株式会社东芝 发明人 山本幸一;河村聪典
分类号 G10L11/02(2006.01);G10L11/00(2006.01);G10L15/00(2006.01);G10L15/02(2006.01);G10L15/28(2006.01) 主分类号 G10L11/02(2006.01)
代理机构 北京市中咨律师事务所 代理人 杨晓光;李峥
主权项 1.一种语音/非语音确定装置,包括:第一存储单元,用于存储变换矩阵,其中,基于从通过学习获取的已知样本计算的实际语音/非语音似然来计算所述变换矩阵;第二存储单元,用于存储语音模型和非语音模型,其中,基于存储在所述第一存储单元中的所述语音/非语音似然来计算所述语音模型和所述非语音模型;获取单元,用于获取声信号;划分单元,用于将所述声信号划分成多个帧;提取单元,用于从所述帧的声信号中提取特征向量;变换单元,用于利用存储在所述第一存储单元中的所述变换矩阵来对所述特征向量进行线性变换,从而获得经线性变换的特征向量;以及确定单元,用于基于在所述经线性变换的特征向量和存储在所述第二存储单元中的所述语音模型及所述非语音模型之间的比较结果来确定所述帧中的每个帧是语音帧还是非语音帧。
地址 日本东京都