发明名称 一种基于GPU实现的快速音频检索方法
摘要 一种基于GPU实现的快速音频检索方法。本发明涉及检索的方法。本发明解决了现有基于内容音频检索方法检索速度慢的问题。一、判断图像处理器GPU中是否有音频片段的特征信息,否进入步骤二,是进入步骤三;二、预处理;三、音频片段向量滑动匹配;四、向量滑动匹配结果是否大于设定的第一阈值的结果,否返回步骤一;是进入步骤五;五、音频片段梅尔倒谱系数特征矩阵匹配;六、梅尔倒谱系数矩阵匹配结果大于设定的第二阈值的结果,否返回步骤一,是判定为匹配成功,对匹配成功的结果进行相应的处理。本方法不仅极大的提高了音频检索速度,而且保证了检索的精确度。
申请公布号 CN102033927B 申请公布日期 2012.09.05
申请号 CN201010589841.2 申请日期 2010.12.15
申请人 哈尔滨工业大学 发明人 韩纪庆;杜艳斌
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 哈尔滨市松花江专利商标事务所 23109 代理人 岳泉清
主权项 一种基于GPU实现的快速音频检索方法,其特征在于它的步骤如下:步骤一:初始:判断图像处理器GPU中是否有音频片段的特征信息,否,则进入步骤二,进行音频流数据的预处理;是,则进入步骤三,进行音频片段的特征信息的向量滑动匹配;步骤二:预处理:中央处理器CPU将输入音频检索系统的音频流数据分割成音频片段,对各个音频片段进行特征提取,并对音频片段的特征信息进行分组,之后将每组音频片段的特征信息依次传输到图像处理器GPU的纹理存储器中;步骤三:音频片段向量滑动匹配:图像处理器GPU的纹理存储器中的向量滑动匹配模块利用音频片段的特征信息中的片段向量特征进行向量滑动匹配,记录向量滑动匹配结果;并通过图像处理器GPU将记录的向量滑动匹配结果发送到中央处理器CPU;将音频数据按固定长度划分成片段,片段内的特征向量的一维量化值构成一个多维向量,称为片段向量;步骤四:第一阈值判断:在中央处理器CPU中顺序遍历所述向量滑动匹配结果,判断所述向量滑动匹配结果是否大于设定的第一阈值的结果,否,则将所述向量滑动匹配结果的音频片段的特征信息传输到图像处理器GPU中;返回步骤一,是,则将所述向量滑动匹配结果的音频片段的特征信息传输到图像处理器GPU的全局存储器中,进入步骤五;步骤五:音频片段梅尔倒谱系数特征矩阵匹配:图像处理器GPU的全局存储器中的梅尔倒谱系数特征矩阵匹配模块利用音频片段的特征信息中的梅尔倒谱系数特征及其差分特征进行梅尔倒谱系数矩阵匹配,记录梅尔倒谱系数矩阵匹配结果;并通过图像处理器GPU将记录的梅尔倒谱系数矩阵匹配结果发送到中央处理器CPU;步骤六:第二阈值判断:在中央处理器CPU中顺序遍历梅尔倒谱系数矩阵匹配结果,判断所述的梅尔倒谱系数矩阵匹配结果是否大于设定的第二阈值的结果,否,则将所述梅尔倒谱系数矩阵匹配结果的音频片段的特征信息传输到图像处理器GPU中,返回步骤一;是,则判定为匹配成功,对匹配成功的结果进行相应的处理。
地址 150001 黑龙江省哈尔滨市南岗区西大直街92号