发明名称 切割语音资料序列的方法
摘要 一种切割语音资料序列的方法,系透过共同路径侦测方式,于部分文句状态序列与部份语音资料序列之多个匹配路径中,寻找一共同路径,记录该共同路径里与文句边界标记相对应之语音边界后,再取出其后之部分文句资料与语音资料序列,作为下一次比对的资料,依此方式逐步求得与文句边界标记相对应之语音边界,最后依照记录之语音边界切割语音资料序列。
申请公布号 TWI261974 申请公布日期 2006.09.11
申请号 TW094132130 申请日期 2005.09.16
申请人 财团法人工业技术研究院 发明人 简世杰
分类号 H03M13/41 主分类号 H03M13/41
代理机构 代理人 许世正 台北市信义区忠孝东路5段410号4楼
主权项 1.一种切割语音资料序列方法,应用于一待处理之语音资料序列,及其对应之一含复数个文句边界标记之文句资料上,该方法包含下列步骤:于该文句资料中,取出一部份之文句资料;于该待处理语音资料中,取出一部份之语音资料序列;取得该部分文句资料与该部分语音资料序列之复数个匹配路径,并由各该匹配路径中取得一段共同路径;当该段共同路径中具有至少一文句边界标记时,记录该段共同路径中各该文句边界标记相对应之各该语音边界;依前述步骤于该段共同路径后之剩余待处理文句资料与语音资料序列中,继续取得下一段共同路径,直至无待处理之该文句资料与语音资料序列为止;于剩余未能找到共同路径的文句资料与语音资料序列中,以最终的一文句资料位置及一语音资料序列位置,取得一匹配路径;当该段匹配路径中具有至少一文句边界标记时,记录该匹配路径中各该文句边界标记相对应之各该语音边界;及依前述步骤所记录之各该语音边界切割该语音资料序列。2.如申请专利范围第1项所述之切割语音资料序列方法,其中若无法由该复数个匹配路径中取得一段共同路径,则再增加一部份之文句资料与语音资料序列进行匹配,直到能找到有一段共同路径。3.如申请专利范围第1项所述之切割语音资料序列方法,其中该匹配路径之数量系由一使用者于方法执行前所预先设定。4.如申请专利范围第1项所述之切割语音资料序列方法,其中当语音边界数量与该文句边界标记数量不相等时,则重新设定该匹配路径之数量后,再次执行本方法以进行切割该语音资料序列。5.如申请专利范围第1项所述之切割语音资料序列方法,其中各该匹配路径之决定系根据维特比演算法(Viterbi algorithm)依据所取出之部分文句资料和部分语音资料序列与一预先训练之声学模型计算其分数値之后,由部分语音资料序列之最终语音位置及由部分文句资料中选定一文句位置推算而得。6.如申请专利范围第1项所述之切割语音资料序列方法,其中复数个匹配路径之决定,系根据部分语音资料序列之最终语音位置所对应的文句位置之分数値取与设定之匹配路径数量相同之复数个具有较高分数値的文句位置之后,依照如申请专利范围第5项所述之匹配路径之决定而得。7.如申请专利范围第1项所述之切割语音资料序列方法,其中该再增加部份之文句资料与语音资料序列量系为一单位资料。8.如申请专利范围第1项所述之切割语音资料序列方法,其中该复数个匹配路径若无法取得一段共同路径,且无一匹配路径为自该部份文句资料之最终文句位置所推算而得时,则只需再增加部份之语音资料序列即可再次进行复数个匹配路径和共同路径之求取。9.一种可切割语音资料序列之电脑,应用于比对切割一待处理之语音资料序列,及其对应之含复数个文句边界标记之一文句资料上,具有一中央处理器、一记忆体、及一作业系统,还包含:一电脑可执行之程式,用以于该文句资料中,取出一部份之文句资料;于该待处理语音资料中,取出一部份之语音资料序列;取得该部分文句资料与该部分语音资料序列之复数个匹配路径,并由各该匹配路径中取得一段共同路径;当该段共同路径中具有至少一文句边界标记时,记录该段共同路径中各该文句边界标记相对应之各该语音边界后;依前述步骤于该段共同路径后之剩余待处理文句资料与语音资料序列中,继续取得下一段共同路径,直至无待处理之该文句资料与语音资料序列为止;于剩余未能找到共同路径的文句资料与语音资料序列中,以最终的一文句资料位置及一语音资料序列位置,取得一匹配路径;当该段匹配路径中具有至少一文句边界标记时,记录该匹配路径中各该文句边界标记相对应之各该语音边界;及依前述步骤所记录之各该语音边界切割该语音资料序列。10.如申请专利范围第9项所述之可切割语音资料序列之电脑,其中若无法由该复数个匹配路径中取得一段共同路径,则再增加一部份之文句资料与语音资料序列进行匹配,直到能找到有一段共同路径。11.如申请专利范围第9项所述之可切割语音资料序列之电脑,其中该匹配路径之数量系由一使用者于方法执行前所预先设定。12.如申请专利范围第9项所述之可切割语音资料序列之电脑,其中当语音边界数量与该文句边界标记数量不相等时,则重新设定该匹配路径之数量后,再次执行本方法以进行切割该语音资料序列。13.如申请专利范围第9项所述之可切割语音资料序列之电脑,其中各该匹配路径之决定系根据维特比演算法(Viterbi algorithm)依据所取出之部分文句资料和部分语音资料序列与一预先训练之声学模型计算其分数値之后,由部分语音资料序列之最终语音位置及由部分文句资料中选定一文句位置推算而得。14.如申请专利范围第9项所述之可切割语音资料序列之电脑,其中复数个匹配路径之决定,系根据部分语音资料序列之最终语音位置所对应的文句位置之分数値取与设定之匹配路径数量相同之复数个具有较高分数値的文句位置之后,依照如申请专利范围第13项所述之匹配路径之决定而得。15.如申请专利范围第9项所述之可切割语音资料序列之电脑,其中该再增加部份之文句资料与语音资料序列量系为一单位资料。16.如申请专利范围第9项所述之可切割语音资料序列之电脑,其中该复数个匹配路径若无法取得一段共同路径,且无一匹配路径为自该部份文句资料之最终文句位置所推算而得时,则只需再增加部份之语音资料序列即可再次进行复数个匹配路径和共同路径之求取。图式简单说明:第1图系本发明利用维特比演算法(Viterbi algorithm)求得文句与语音资料对应之最佳路径示意图;第2a-2d图系本发明之方法流程图;第3图系本发明于部分搜寻空间求得可靠段落之示意图;第4图系本发明在求得一段可靠段落后,纪录语音边界和进行下一次匹配资料安排之示意图;及第5图系本发明无存在有一共同路径额外增加文句和语音资料之示意图。
地址 新竹县竹东镇中兴路4段195号