发明名称 一种用于音频内容识别的同步方法
摘要 本发明提供一种用于识别音频的同步方法,该方法既适用于音乐信息的识别中,又适用于语音信息的识别。实现本发明目的技术方案是:一种用于音频内容识别的同步方法,该方法包括下列步骤:步骤1.提取两个音频信号的频域或时域的特征点;步骤2.将两个音频的特征点分别组成特征点组;步骤3.对两个特征点组进行匹配,找到匹配点,将二者在匹配点上开始同步。
申请公布号 CN101763848B 申请公布日期 2013.06.12
申请号 CN200810243580.1 申请日期 2008.12.23
申请人 王宏宇 发明人 王宏宇;杨光;严荣荣;曹辉
分类号 G10H1/00(2006.01)I;G10H1/36(2006.01)I;G10L15/20(2006.01)I;G10L15/02(2006.01)I 主分类号 G10H1/00(2006.01)I
代理机构 南京知识律师事务所 32207 代理人 樊文红
主权项 一种用于音频内容识别的同步方法,其特征是,该方法包括下列步骤:步骤1采用以帧为单位,计算归一化能量差的方式,提取两个音频信号的频域或时域的特征点;步骤2以选取帧间能量差最大的若干点组成特征点组的筛选方式,将两个音频的特征点分别组成特征点组;步骤3采用特征点组之间的时间差作为参考同步特征,对两个特征点组进行匹配,找到匹配点,将二者在匹配点上开始同步。
地址 210018 江苏省南京市玄武区珠江路88号新世界中心A座2411