发明名称 生成音频缩略图的系统和方法
摘要 本发明涉及便于自动生成助记音频部分或片断(被称为音频缩略图)的系统和方法。提供了一种系统用于概括音频信息。该系统包括一确定音频文件中的公共特征的分析组件,以及一部分地基于公共特征提取音频文件的指纹部分以生成音频文件的缩略图的助记检测器。所生成的缩略图然后可用于方便浏览或搜索音频文件,以减轻收听这类文件的较长部分或片断的问题。
申请公布号 CN100461168C 申请公布日期 2009.02.11
申请号 CN200510052866.8 申请日期 2005.02.24
申请人 微软公司 发明人 C·J·C·布吉斯;D·普拉斯迪纳;E·L·任斯豪;H·S·马尔瓦;J·C·普拉特
分类号 G06F17/30(2006.01);G11B27/10(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 上海专利商标事务所有限公司 代理人 张政权
主权项 1.一种用于概括音频信息的系统,其特征在于,包括:一分析器,它将音频转换成帧;一加指纹组件,它将所述帧转换成指纹,每一指纹部分地基于多个帧;一相似度检测器,它计算指纹之间的相似度,所述相似度检测器包括一聚集功能,所述聚集功能基于满足表示相似度的一初始阈值的一组群集内的所有指纹产生一组或多组指纹群集;一试探模块,它从所述一组或多组指纹群集中的指纹间具有至少两个间距的一组指纹群集中生成所述音频的缩略图,其中所述间距是所述一组或多组指纹群集中的一组指纹群集中指纹按时间顺序放置时两个相邻指纹之间超出一预定阈值的时间间隔,所述试探模块包括能量组件和平直度组件中的至少一个,以帮助确定一用于所述缩略图的合适的音频分段。
地址 美国华盛顿州