发明名称 音频快速搜索方法
摘要 快速音频搜索方法提出了基于时-频域频谱描述的快速音频搜索方法。该方法的基本特征是利用音频信号子带能量比作为基本特征,以直方图作为建模方法,对目标音频的出现位置进行跳跃检出,最基本特征,一是选择合适的子带,使得该频带的信号在统计意义上对于噪声信号和畸变具有最佳的鲁棒性;二是根据目标音频的频谱分布,自适应的调整VQ量化边界;三是借鉴了图像识别中广泛使用的直方图匹配算法。子带能量信号作归一化后,避免了常规方法中因背景噪声干扰等畸变造成的检出错误和漏检,而且计算量很小;四是提出了建立音频搜索算法的性能评价标准,并设计分析了检索结果的客观评价参数。
申请公布号 CN100424692C 申请公布日期 2008.10.08
申请号 CN200510086315.3 申请日期 2005.08.31
申请人 中国科学院自动化研究所 发明人 梁伟;张树武;徐波
分类号 G06F17/30(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 中科专利商标代理有限责任公司 代理人 段成云
主权项 1. 一种音频快速搜索方法,利用音频信号子带能量比作为基本特征,以直方图作为建模方法,对目标音频的出现位置进行跳跃检出,该方法的最基本特征,一是选择合适的子带,使得该子带的信号在统计意义上对于噪声信号和畸变具有最佳的鲁棒性;二是根据目标音频的频谱分布,自适应的调整向量量化边界;三是借鉴了图像识别中广泛使用的直方图匹配算法,子带能量信号作归一化后,避免了常规方法中因背景噪声干扰畸变造成的检出错误和漏检,而且计算量很小;四是建立音频搜索算法的性能评价标准,并设计分析检索结果的客观评价参数。
地址 100080北京市海淀区中关村东路95号