发明名称 语音辨识方法与装置
摘要 一种用于本申请案之语音辨识的方法和装置具有一程序,用一输入语调来勘校对应于要由诸如音素或音节的语调段落之连接来表达、且根据一输入语调之长度由一字组间连接规则来发展的一假设之一音响模型,藉此获得一辨识分数。在该假设之一字组内,在来自分数之最大值的一预定临界值内、在语调分数上高的相似假设,不管假设之数目地、都被保持于一字组末端。同时,在假设之一字组末端,该等假设以较高分数之次序、被窄化成一预定数目之较上等级。
申请公布号 TW561452 申请公布日期 2003.11.11
申请号 TW090133371 申请日期 2001.12.31
申请人 松下电器产业股份有限公司 发明人 小沼知浩;井上刚;远藤充;齐藤夏树;石田明;木村达也
分类号 G10L15/00 主分类号 G10L15/00
代理机构 代理人 恽轶群 台北市松山区南京东路三段二四八号七楼;陈文郎 台北市松山区南京东路三段二四八号七楼
主权项 1.一种用于语音辨识之方法,包含有:一特征量抽取步骤,根据一输入语调之一讯框来抽取一特征量;一储存步骤,用来判定一目前处理讯框是在先前登记的一候选字组内或在其之一末端,且当在一字组内时根据一第一假设储存判定评准、而在一字组末端时根据一第二假设储存判定评准、来储存该候选字组;一发展步骤,当一经储存候选字组处在一字组内时藉由延伸表达该字组的语调段落、且当在一字组末端时藉由根据一字组间连接规则来连结尾随的一字组、来发展一假设;一运算步骤,用来计算在自该输入语调抽取的特征量、和该经发展假设之一音响模型的一讯框基底特征量间之一相似度,且从该相似度、和高达自该相似度计算的一紧接在前讯框之假设的一辨识分数、来计算一新的辨识分数;及一重复步骤,其重复该储存步骤、该发展步骤及该操作步骤、直到该处理讯框变为该输入语调的一最后讯框为止,且在一辨识结果近似该输入语调时、以由处理该最后讯框所得的较高辨识分数之次序、来输出假设中的至少一个。2.依据申请专利范围第1项之方法,其中该第一假设储存判定评准系从该辨识分数之一最大値、来选择在一预定临界値内之候选字组,而该第二假设储存判定评准系来选择一预定数目之候选字组、作为从在该辨识分数中最大之一候选字组所计算者。3.一种用于语音辨识之装置,包含有:一特征量抽取部段,根据一输入语调之一讯框来抽取一特征量;一搜寻控制部段,用来控制、当该假设处在一字组内时藉由延伸表达一字组的语调段落、且当在一字组末端时藉由根据先前决定之一字组间连接规则来连结尾随的一字组、来发展一假设;一相似度计算部段,用来计算在自该输入语调抽取的一讯框特征量、和该经发展假设之一音响模型的一讯框特征量间之一相似度;一搜寻运算部段,用来从该相似度、和高达一紧接在前讯框之假设的辨识分数、来运算一辨识分数;一假设判定部段,用来判定一目前处理讯框是在该假设之一字组内或在其之一字组末端,且使用该辨识分数、当在一字组内时根据一第一判定评准来选择一候选字组、而在一字组末端时根据一第二判定评准、来选择一候选字组;一假设储存装置,用来储存经判定要储存的一假设;一字组假设登记装置,用来把该假设和该辨识分数、登记为一新的假设;及一辨识结果输出部段,用来继续该讯框基底程序至该输入语调之最后、且以较高辨识分数之次序来输出至少一假设。4.依据申请专利范围第3项之装置,其中该第一判定评准系从该辨识分数之一最大値、来选择在一预定临界値内之候选字组,而该第二判定评准系来选择一预定数目之候选字组、作为从在该辨识分数中最大之一候选字组所计算者。5.一种记录程式之可电脑读取记录媒体,该程式系用来执行:一特征量抽取步骤,根据一输入语调之一讯框来抽取一特征量;一储存步骤,用来判定一目前处理讯框是在先前登记的一候选字组内或在其之一末端,且当在一字组内时根据一第一假设储存判定评准、而在一字组末端时根据一第二假设储存判定评准、来储存该候选字组;一发展步骤,当一经储存候选字组处在一字组内时藉由延伸表达该字组的语调段落、且当在一字组末端时藉由根据一字组间连接规则来连结尾随的一字组、来发展一假设;一操作步骤,用来计算在自该输入语调抽取的该特征量、和该经发展假设之一音响模型的一讯框基底特征量间之一相似度,且从该相似度、和高达自该相似度计算的一紧接在前讯框之假设的一辨识分数、来计算一新的辨识分数;及一重复步骤,其重复该储存步骤、该发展步骤及该操作步骤、直到该处理讯框变为该输入语调的一最后讯框为止,且在一辨识结果近似该输入语调时、以由处理该最后讯框所得的较高辨识分数之次序、来输出假设中的至少一个。6.依据申请专利范围第5项之记录程式的可电脑读取记录媒体,其中该第一假设储存判定评准系从该辨识分数之一最大値、来选择在一预定临界値内之候选字组,而该第二假设储存判定评准系来选择一预定数目之候选字组、作为从在该辨识分数中最大之一候选字组所计算者。图式简单说明:第1图系显示在本发明之一实施例中的一语音辨识装置之一系统组态图;第2图系在发明之实施例中的一语音辨识处理部段之硬体组态的方块图;第3图系在发明之实施例中的一语音辨识处理部段之功能组态的方块图;第4图系显示在发明之实施例中的语音辨识处理部段之程序的流程图;第5图系在发明之实施例中、要先被登记的一组候选字组、及其辨识分数上的解说图;第6图系在发明之实施例中、用于假设判定的程序图;第7图显示在发明之实施例中、一字组间连接规则的例图;及第8图系显示一相关技术的程序之流程图。
地址 日本