发明名称 语音识别系统及语音处理系统
摘要 本发明提供一种语音识别系统及语音处理系统,其中,在用户进行自我修正发音的情况下,如同人们之间的对话一样,可输入并正确识别自我修正发音。所述系统包括:信号处理单元,用于将讲话语音数据转换为特征;语音区段检测单元,用于检测讲话语音数据中的语音区段;优先级确定单元,用于根据预定的优先级标准,从由语音区段检测单元检测的语音区段中选择要给予优先级的语音区段;以及解码器,用于利用由优先级确定单元所选择的语音区段的特征以及声学模型,计算与识别词汇的匹配度。优先级确定单元从由下标准构成的组中所选择的至少一个标准作为预定的优先级标准:语音区段的长度,语音区段的功率或信噪比,以及语音区段的时间顺序。
申请公布号 CN1920948B 申请公布日期 2010.05.12
申请号 CN200610006952.X 申请日期 2006.01.26
申请人 富士通株式会社 发明人 鹫尾信之;原田将治
分类号 G10L15/04(2006.01)I;G10L15/00(2006.01)I 主分类号 G10L15/04(2006.01)I
代理机构 隆天国际知识产权代理有限公司 72003 代理人 王玉双;高龙鑫
主权项 一种语音识别系统,包括:信号处理单元,用于将输入的讲话语音数据转换为特征;声学模型存储单元,该单元中预先存储通过模型化语音的特征而获得的声学模型;词汇辞典存储单元,该单元中预先存储识别词汇的信息;语音区段检测单元,用于根据预定的语音区段标准,检测该讲话语音数据中的语音区段;优先级确定单元,用于在不使用识别讲话词汇序列的任何结果的情况下,根据预定的优先级标准,从由该语音区段检测单元检测的各语音区段中选择包括自我修正发音的语音区段;解码器,用于利用由该优先级确定单元所选择的语音区段的特征以及该声学模型,匹配该特征和该声学模型,并且计算匹配的结果与该识别词汇之间的匹配分数;以及结果输出单元,用于输出在由解码器进行匹配中具有最大分数的单词序列,以作为识别结果;其中该优先级确定单元使用从由以下标准构成的组中所选择的至少一个标准作为该预定的优先级标准:(1)语音区段的长度,(2)语音区段的功率或信噪比,以及(3)语音区段的时间顺序。
地址 日本神奈川县