发明名称 生成声音模型的方法、装置和生成声音模型的计算机程序
摘要 本发明提供能防止杂音环境中的适合模型的精度下降的声音模型生成方法。根据声音上的接近程度,把叠加有杂音的声音数据分组。使用各组中包含的声音数据来生成充分统计量。选择在声音上接近利用声音识别的人即使用者的声音数据的组。从关于选择的组的充分统计量中选择在声音上接近使用者的声音数据的充分统计量。使用选择的充分统计量来生成声音模型。
申请公布号 CN1237502C 申请公布日期 2006.01.18
申请号 CN02157472.3 申请日期 2002.12.20
申请人 松下电器产业株式会社 发明人 芳泽伸一;鹿野清宏
分类号 G10L15/00(2006.01);G10L15/18(2006.01) 主分类号 G10L15/00(2006.01)
代理机构 中科专利商标代理有限责任公司 代理人 汪惠民
主权项 1.一种方法,生成用于声音识别的声音模型,其特征在于:包括:在声音中叠加有杂音,根据声音的接近程度,把叠加有所述杂音的声音数据分组的步骤(a);关于由所述步骤(a)获得的各组,使用包含在该组中的声音数据来生成充分统计量的步骤(b);从由所述步骤(a)获得的各组中,选择在声音上接近利用声音识别的人即使用者的声音数据的组的步骤(c);从关于由所述步骤(c)选择的组的充分统计量中,选择在声音上接近所述使用者的声音数据的充分统计量的步骤(d);使用由所述步骤(d)选择的充分统计量来生成声音模型的步骤(e),在所述使用者利用声音识别的时刻之前,脱机执行所述步骤(a)和(b),在所述步骤(a)中,至少执行下述(a1)~(a3)中的至少一步,(a1)根据所述杂音的种类来进行分组,(a2)根据叠加有所述杂音的声音数据的SN比来进行分组,(a3)按照声音上接近的各说话者来进行分组,在所述步骤(b)中,至少执行下述(b1)~(b4)中的至少一步,(b1)针对每一说话者来生成充分统计量,(b2)按照说话者声音的各声调来生成充分统计量,(b3)按照所述杂音的各种类来生成充分统计量,(b4)按照所述各组中包含的声音数据的SN比来生成充分统计量。
地址 日本大阪府