发明名称 基于模糊聚类决策树的分布式大型人口语者识别方法
摘要 基于模糊聚类决策树的分布式大型人口语者识别方法首先将训练数据等分成几个部分,再对着几个部分分别使用基于模糊聚类的决策树分类;然后决定测试语者属于哪棵树的哪个叶节点;再对该选定的叶节点使用梅尔频率倒谱系数和高斯混合模型识别方法识别该语者身份。在本发明中,对训练数据模糊聚类的过程主要包括以下几个步骤:一是根据相应的层提取特征数据;二是计算特征数据的均值和标准差得到信任间距集合D;三是对集合D使用Lloyd算法得到分隔向量;四是以分隔向量为基础进行聚类分组得到下一层的节点。本发明可以显著提高分类准确率,具有更高的准确识别率和更低的计算复杂性,极大地提高了分类的效率,对加性噪声有良好的抗干扰力。
申请公布号 CN105006231A 申请公布日期 2015.10.28
申请号 CN201510234252.5 申请日期 2015.05.08
申请人 南京邮电大学 发明人 陈志;芮路;岳文静;黄继鹏;顾振兴;崔鸣浩;吴向忠;黄本轩
分类号 G10L15/30(2013.01)I 主分类号 G10L15/30(2013.01)I
代理机构 南京知识律师事务所 32207 代理人 汪旭东
主权项 一种基于模糊聚类决策树的分布式大型人口语者识别方法,其特征在于该方法包括以下步骤:步骤1)将语音样本数据等分成三个部分;分别将等分后的语音样本数据作为一棵决策树的根节点C<sub>1</sub>进行建树;每一个语音样本都来自不同的语者,<img file="re-FDA0000781406450000012.GIF" wi="270" he="97" />表示L层的第n<sub>L+1</sub>个节点;同时对三个语音样本数据执行同样的操作进行分类建树和语音识别;对根节点进行分组,得到的子节点执行相同的步骤继续进行分组直到建成决策树;步骤2)判断当前节点中的样本数量是否大于预设值,当前节点中的样本数量不大于预设值,该节点为叶节点,不要再进行分组;步骤3)对节点上的样本进行特征提取,每一层只提取一种特征,依次提取音调、语音信号正脉冲的均值、语音信号正脉冲的偏斜、语音信号负脉冲的均值、语音信号负脉冲的偏斜和语音信号正脉冲的宽度;步骤4)计算每个语者特征数据的平均值和标准差,计算公式为:<img file="re-FDA0000781406450000011.GIF" wi="1011" he="205" />所述μ<sub>i</sub>为语者i的特征数据的平均值,σ<sub>i</sub>为语者i的特征数据的标准差F<sub>i,j</sub>为提取出的特征,i是当前节点上的语者索引,j=1,2,...,N<sub>i</sub>是特征索引,N<sub>i</sub>表示语者i的特征值的总数;然后构建一个可信任的间距[μ<sub>i</sub>‑λδ<sub>i</sub>,μ<sub>i</sub>+λδ<sub>i</sub>],λ是一个预定的系数;得到所有语者两个统计数据μ<sub>i</sub>±λδ<sub>i</sub>的集合D={μ<sub>i</sub>‑λδ<sub>i</sub>,μ<sub>i</sub>+λδ<sub>i</sub>};步骤5)对集合D使用Lloyd算法得到分隔向量[P<sub>0</sub>,P<sub>1</sub>,...,P<sub>M</sub>],M为Lloyd的算法采用的语者组的总数;所述Lloyd算法是计算机科学领域中的k‑平均算法,用于把观测按照距离分配到最近的聚类;步骤6)对每个语者i进行分组,i∈C<sub>1</sub>,判断其属于C<sub>1,m</sub>中的哪一个,m=1,2,...,M,具体步骤如下:步骤6.1)首先令m=1;步骤6.2)然后判断[μ<sub>i</sub>‑λδ<sub>i</sub>,μ<sub>i</sub>+λδ<sub>i</sub>]∩[P<sub>m‑1</sub>P<sub>m</sub>]是否大于0,若是则语者i属于C<sub>1,m</sub>然后进行下一步,若不是则直接进行下一步;步骤6.3)判断m是否等于M,若是则结束,若不是则令m=m+1然后重复步骤6.2直到将所有的语者都分组完毕,所得的C<sub>1,m</sub>即是决策树的下一层;步骤7)对一个测试下的语者进行身份识别,具体步骤如下:步骤7.1)输入测试语者的语音;步骤7.2)对已建好的三棵决策树,分别同时从决策树的根节点开始,对测试语者进行分类,直到其中一棵树分类完成,即识别出该语者身份;步骤7.3)从树的根节点开始,对测试语者进行分类直到结束或找到测试语者属于的叶节点,对树的每个节点分别执行步骤7.4)和步骤7.5)的分类步骤;所述树的每个节点是非叶子节点或者叶子节点,所述根节点是非叶子节点或者叶子节点;步骤7.4)判断该节点是否为叶节点,若是叶节点则对该节点使用梅尔频率倒谱系数和高斯混合模型进行身份识别;对测试语者的语音进行特征提取和异常值去除,提取方法同步骤3)相同,且相应的层只提取相应的特征,得到特征集合{F<sub>k</sub>},k=1,2,...,K,K为特征值总数;计算特征值的平均值<img file="re-FDA0000781406450000021.GIF" wi="278" he="198" />步骤7.5)通过比较平均值和从模糊聚类中的Lloyd算法得到的分隔向量[P<sub>0</sub>,P<sub>1</sub>,...,P<sub>M</sub>]来做分类决定,具体步骤如下:步骤7.5.1)首先令m=1;步骤7.5.2)判断是否有P<sub>m‑1</sub>≤μ≤P<sub>m</sub>,若不是则令m=m+1重复此步骤继续判断直到m=M,若是则该测试语者被分类到子节点且此层分类结束。
地址 210003 江苏省南京市栖霞区文苑路9号