发明名称 | 说话人标准化方法及用该方法的语音识别装置 | ||
摘要 | 将输入语音切分为一定时间长度作为帧,抽取每帧的音响特征量,利用预先规定的多个频率变换系数将所述音响特征量进行频率变换。利用通过频率变换得到的多个变换后特征量及至少1个标准音韵模型的全部组合,计算每帧的变换后特征量与标准音韵模型的多个类似度或距离,利用该多个类似度或距离,决定使输入语音标准化用的频率变换条件,利用决定的频率变换条件使输入语音标准化。根据该方法,即使发出语音的说话人调换,也能够补偿输入语音的个人差别,提高语音识别性能。 | ||
申请公布号 | CN1494053A | 申请公布日期 | 2004.05.05 |
申请号 | CN03160348.3 | 申请日期 | 2003.09.24 |
申请人 | 松下电器产业株式会社 | 发明人 | 森井景子;中藤良久;桑野裕康 |
分类号 | G10L15/00 | 主分类号 | G10L15/00 |
代理机构 | 上海专利商标事务所 | 代理人 | 包于俊 |
主权项 | 1.一种说话人标准化方法,其特征在于,包含将输入语音切分为一定时间长度作为帧、并提取所述每帧的音响特征量的特征量提取步骤;对所述音响特征量用预先规定的各个频率变换系数进行频率变换的频率变换步骤;利用由所述频率变换得到的多个变换后特征量与至少一个标准音韵模型的全部组合、计算所述每帧的变换后特征量与标准音韵模型的多个类似度或距离的步骤;利用所述多个类似度或距离、决定使所述输入语音标准化用的频率变换条件的步骤;以及利用所述频率变换条件使所述输入语音标准化的步骤。 | ||
地址 | 日本国大阪府门真市 |