发明名称 |
使用听觉注意线索进行音调/语调识别的方法 |
摘要 |
在音调/语调识别的口语处理方法中,可以为输入窗的声音确定听觉谱,并且可以从听觉谱中提取一个或多个多尺度特征。每个多尺度特征使用单独二维频谱-空间接收滤波器来提取。可以生成与一个或多个多尺度特征相对应的一个或多个特征图,并且可以从一个或多个特征图的每一个中提取听觉要点矢量。可以通过扩大从一个或多个特征图中提取的每个听觉要点矢量获取累积要点矢量。可以通过使用机器学算法将累积要点矢量映射到一个或多个音调特点确定与输入窗的声音相对应的一个或多个音调特点。 |
申请公布号 |
CN103765506A |
申请公布日期 |
2014.04.30 |
申请号 |
CN201180063717.5 |
申请日期 |
2011.09.19 |
申请人 |
索尼电脑娱乐公司 |
发明人 |
O.卡林利 |
分类号 |
G10L15/18(2013.01)I;G10L17/26(2013.01)I |
主分类号 |
G10L15/18(2013.01)I |
代理机构 |
北京市柳沈律师事务所 11105 |
代理人 |
黄小临 |
主权项 |
一种在口语处理中进行音调/语调识别的方法,其包含:a)为输入窗的声音确定听觉谱;b)从听觉谱中提取一个或多个多尺度特征,其中每个多尺度特征使用单独二维频谱‑空间接收滤波器来提取;c)生成与一个或多个多尺度特征相对应的一个或多个特征图;d)从一个或多个特征图的每一个中提取听觉要点矢量;e)通过扩大从一个或多个特征图中提取的每个听觉要点矢量来获取累积要点矢量;以及f)通过使用机器学习算法将累积要点矢量映射到一个或多个音调特点来确定与输入窗的声音相对应的一个或多个音调特点。 |
地址 |
日本东京都 |