发明名称 一种固定音频检索方法
摘要 本发明公开了一种固定音频检索方法,在建立音频数据检索数据库时,首先按检测段提取音频数据的特征建立索引表,然后对音频数据指纹段中信息量比较高的音频段建立二级索引。在检索目标音频数据阶段先根据目标音频数据的分类对待检索的目标音频数据进行分段,对信息量比较高的音频数据段进行快速查询得到可能的候选位置,然后用目标音频数据在候选位置附近进行精细查询。采用了本发明的技术方案,通过对音频数据库进行高质量索引,查询时采用粗细结合分级别查询方式,可以大大减少计算复杂度,提高查询效率。
申请公布号 CN102622353B 申请公布日期 2013.10.16
申请号 CN201110028979.X 申请日期 2011.01.27
申请人 天脉聚源(北京)传媒科技有限公司 发明人 刘赵杰
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种固定音频检索方法,其特征在于,包括以下步骤:A、通过静音段对音频数据进行分段,形成非静音的音频数据检测段;B、对音频数据检测段进行谐波检测,并对音频数据检测段进行分类,形成音频数据指纹段分类索引;C、将音频数据检测段转换并分成固定长度的音频数据指纹段,根据信息量对音频数据指纹段进行标识分类,形成音频数据指纹段索引;D、对每个音频数据指纹段提取音频数据指纹特征,建立音频数据指纹索引;E、通过静音段对待检索音频数据进行分段,形成非静音的待检索音频数据检测段,从中选取不少于一段时间最长的待检索音频数据检测段作为查询音频数据检测段;F、对查询音频数据检测段进行谐波检测,确定查询音频数据检测段的类别,通过音频指纹段分类索引,找到查询音频数据检测段对应的音频数据检测段;G、将查询音频数据检测段分成固定长度的查询音频数据指纹段,逐段评估查询音频数据指纹段的信息量,选取信息量超过预设阈值的最长连续查询音频数据指纹段作为查询音频数据段;H、在所述的对应的音频数据检测段中,通过音频数据指纹段索引,获得查询音频数据段在所述对应的音频数据检测段中的候选位置;I、通过音频数据指纹索引,将查询音频数据段与所述对应的音频数据检测段中的候选位置进行匹配,获得音频检索结果。
地址 100007 北京市东城区安定门东大街28号2号楼816室