发明名称 多格式音频感知哈希认证的特征值提取及认证方法
摘要 多格式音频感知哈希认证的特征值提取及认证方法,主要解决现有音频认证算法认证音频格式单一、认证算法不通用、认证效率低的问题;本发明基于双树复小波变换(DT‑CWT)原理,首先对预处理后的音频信号进行全局双数复小波变换(DT‑CWT),提取音频信号的实小波系数;接着对实小波系数进行二次差分、分帧,计算帧系数自然对数下的和值,作为音频信号的特征向量;最后对特征向量进行哈希构造,生成感知哈希摘要序列,通过哈希匹配实现了对音频内容的快速认证。
申请公布号 CN104091104B 申请公布日期 2017.03.15
申请号 CN201410312292.2 申请日期 2014.07.02
申请人 兰州理工大学 发明人 张秋余;省鹏飞;黄羿博;杨仲平;任占伟;余爽
分类号 G06F21/32(2013.01)I;G10L19/087(2013.01)I;G10L19/032(2013.01)I;G10L25/45(2013.01)I 主分类号 G06F21/32(2013.01)I
代理机构 兰州振华专利代理有限责任公司 62102 代理人 董斌
主权项 多格式音频感知哈希认证的特征值提取及认证方法,其步骤为:(1)对音频信号S进行预加重处理;(2)对预加重后的信号进行3级双树复小波变换(DT‑CWT)分解,得到树A的实小波系数和树B的复小波系数,提取树A的实小波系数R<sub>A</sub>;(3)对实小波系数R<sub>A</sub>进行二阶差分,获得差分信号;(4)对差分信号进行不重叠分帧,帧长为2.5ms;(5)计算帧系数自然对数下特征值序列的和值E<maths num="0001"><math><![CDATA[<mrow><mi>E</mi><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mi>j</mi><mo>&Element;</mo><mi>M</mi></mrow><mi>N</mi></munderover><msup><mi>e</mi><msubsup><mi>D</mi><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow><mi>A</mi></msubsup></msup></mrow>]]></math><img file="FDA0001128218970000011.GIF" wi="1038" he="263" /></maths>其中,<img file="FDA0001128218970000012.GIF" wi="105" he="86" />是第j帧第i个小波系数,M是实小波系数的分帧总帧数,N是帧长度;(6)生成音频信号特征向量H,<img file="FDA0001128218970000013.GIF" wi="309" he="79" />其中,<img file="FDA0001128218970000014.GIF" wi="51" he="71" />是特征值序列E的中值;(7)对向量H进行量化处理,生成感知哈希序列h;(8)哈希匹配:按上述(1)~(7)的步骤先从原始音频信号中提取出哈希特征向量,将其转换为感知哈希认证序列h,用同样的方法计算待测音频信号感知哈希认证序列h',再将两者进行匹配,匹配结果与阈值相比较;两段感知内容相同音频信号的比特误码率(BER)值小于匹配阈值,认证通过;相反,感知不同语音的BER应大于匹配阈值,则认证不通过。
地址 730050 甘肃省兰州市兰工坪287号