发明名称 基于特征的音频内容识别
摘要 根据半音音程分析音频(402-406)并对于每个半音频道计算平均值(408-410)。对于每个半音频道计算移动平均值(412)并比较这些平均值以了解它们是否相交(414、416)。标记出相交事件并利用该些相交事件以及频谱数据以确定存储的声音模式和输入音频之间的匹配。
申请公布号 CN1623289A 申请公布日期 2005.06.01
申请号 CN02828684.7 申请日期 2002.04.05
申请人 国际商业机器公司 发明人 M·C·皮特曼;B·G·菲奇;S·艾布拉姆斯;R·S·杰曼
分类号 H04H9/00;G10L17/00 主分类号 H04H9/00
代理机构 北京市中咨律师事务所 代理人 于静;李峥
主权项 1.一种用于识别音频内容的方法,所述方法包括如下步骤:获得一以一依赖于时间的功率谱为特征的音频信号;分析该功率谱以获得多个依赖于时间的频率分量;以及在该多个依赖于时间的频率分量中检测到多个事件。
地址 美国纽约