发明名称 用于音频媒体识别的系统和方法
摘要 提供采样媒体内容的自动识别。针对音频信号的相继时间分片生成声谱图。针对时间片通过计算来自用于时间片的列中的相应频率仓的量值的比率来生成一个或者多个采样散列矢量。在一级评估阶段中,执行采样散列矢量的位与查找表中的条目的确切匹配以标识一个或者多个参考散列矢量的组。在二级评估阶段中,执行在采样散列矢量与参考散列矢量组中的每个之间的相似程度以标识任何参考散列矢量,这些任何参考散列矢量是用于匹配采样媒体内容的候选,每个参考散列矢量代表参考媒体内容的时间分片。
申请公布号 CN102959624B 申请公布日期 2015.04.22
申请号 CN201180028693.X 申请日期 2011.06.02
申请人 阿德尔福伊有限公司 发明人 亚历山大·保罗·塞尔比;马克·圣·约翰·欧文
分类号 G10L25/00(2013.01)I 主分类号 G10L25/00(2013.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 王萍;李春晖
主权项 一种用于提供通过与参考媒体内容比较从源信号自动识别源媒体内容的装置,所述装置包括:声谱图生成器,可操作用于通过向所述源信号应用傅里叶变换来根据所述源信号生成声谱图,所述声谱图包括多个列,每个列代表时间分片,并且包括多个频率仓,每个频率仓代表用于所述源信号的所述时间分片的相应频率分量范围;矢量生成器,可操作用于通过计算来自用于所述源信号的时间分片的所述列中的所选频率仓的量值的比率来生成用于所述源信号的所述时间分片的至少一个源矢量,并且量化所述比率以生成源矢量的数字,其中,为了生成用于时间分片的至少一个矢量,所述矢量生成器可操作用于针对时间分片的至少一个所选频率仓,计算该仓的量值与来自用于所述时间分片的所述列中的邻近或次邻近频率仓的量值的比率;并且将所述比率划分成范围以生成用于每个比率的至少一个所选数字;一级评估器,可操作用于通过执行第一矢量的数字与查找表中的条目的确切匹配来执行一级评估,其中所述查找表中的每个条目与第二矢量组关联,并且其中用来执行所述确切匹配的所述第一矢量的数字的数目在所述查找表中的条目之间不同;二级评估器,可操作用于执行二级评估以确定在所述第一矢量与所述第二矢量组中的每个之间的相似程度,以标识任何第二矢量,所述任何第二矢量是用于匹配所述源媒体内容与所述参考媒体内容的候选;以及数据库,包括所述查找表和所述第二矢量,其中所述第一矢量是源矢量或者参考矢量,并且所述第二矢量是所述源矢量和所述参考矢量中的另一种矢量,每个参考矢量代表所述参考媒体内容的时间分片。
地址 英国伦敦