发明名称 一种国语单音辨认方法
摘要 本发明为一种国语单音辨认方法,其包含:一先前处理器,一已知单音音波正常化与抽取大小一致的特征矩阵方法:用弹性框将音波正常化并转换成大小相等的线性预估编码倒频谱特征矩阵,将相同已知单音音波转换成特征相同的矩阵;对每个已知单音,选择K个最好样本;一已知单音特征矩阵的K个最好样本转换成一标准模型,储藏在数据库,标准模型含有已知单音特征矩阵的K个最好样本平均数与变异数;将未知单音音波正常化并转换成大小与已知标准模型大小相等的特征矩阵,内含有线性预估编码倒频谱,叫做未知单音分类模型;将未知单音分类模型与数据库所有已知单音标准模型比较,找一已知单音。它和未知单音贝式距离达最小,辨认为未知单音。
申请公布号 CN101339765B 申请公布日期 2011.04.13
申请号 CN200710122960.5 申请日期 2007.07.04
申请人 黎自奋;李台珍;廖丽娟 发明人 黎自奋;李台珍;廖丽娟
分类号 G10L15/02(2006.01)I;G10L15/08(2006.01)I;G10L19/04(2006.01)I 主分类号 G10L15/02(2006.01)I
代理机构 北京科龙寰宇知识产权代理有限责任公司 11139 代理人 孙皓晨
主权项 一种国语单音辨认方法,其特征在于:其包含:步骤(1):一个先前处理器,删去不具语音音波信号点或杂音;步骤(2):一个已知单音音波正常化与抽取大小一致的特征矩阵方法:用弹性框将音波正常化并转换成大小相等的线性预估编码倒频谱特征矩阵,并将相同已知单音音波转换成特征相同的矩阵;步骤(3):在数据库中,对每个已知单音,选择K个最好样本;步骤(4):一个已知单音特征矩阵的K个最好样本转换成一个标准模型,储藏在数据库,标准模型含有所述的已知单音特征矩阵的K个最好样本平均数与变异数;步骤(5):一个未知单音音波正常化与抽取特征的方法:将音波正常化并转换成大小与已知标准模型大小相等的特征矩阵,称为未知单音分类模型,内含有线性预估编码倒频谱;步骤(6):一个简化贝氏分类法:将未知单音分类模型与数据库所有已知单音标准模型比较,找一个已知单音,它和未知单音贝式距离达最小,辨认为未知单音;步骤(2)包含已知单音音波正常化与抽取大小一致的特征矩阵方法,步骤如下:一个均等分一个已知单音音波信号点方法,为了用线性变化的回归模式密切估计非线性变化的音波,将音波全长分成E等时段,每时段形成一个弹性框,一个单音共有E个弹性框,没有滤波器,不重迭,可以自由伸缩涵盖全长音波,不是固定长度的汉明窗;每框内,用一随时间作线性变化的回归模式估计随时间作非线性变化的音波;用Durbin’s循环方式求回归系数最小平方估计值,叫做线性预估编码向量,再转换线性预估编码向量为稳定的线性预估编码倒频谱向量;用E个线性预估编码倒频谱向量表示一个单音的E×P线性预估编码倒频谱特征矩阵,P为每个弹性框内的信号点数;一个已知单音,由多人发音,产生长短不一的音波,因代表相同已知单音,长短不一的音波包含一种随时间作非线性变化但相同动态特征,只是时间位置不同;用E个弹性框将所述的单音长短不一的音波调整并转换成多个线性预估编码倒频谱特征大致相同的矩阵样本。
地址 中国台湾台中市北区博馆路30号3楼