发明名称 基于听觉特性与整型提升小波的数字音频水印嵌入与检测方法
摘要 本发明所述的基于听觉特性与整型提升小波的数字音频水印嵌入与检测方法是一种将灰度图像(或彩色图像)嵌入到原始数字音频作品的新数字水印方法,属于信息安全、多媒体信息处理领域。本发明首先利用静态图像压缩编码技术,将水印图像(灰度图像或彩色图像)编码成一维二进制序列并进行置乱加密;然后对数字音频信号进行分段处理,并依据人类听觉系统的时域掩蔽特性自适应选择音频段做整型提升小波变换;再依据人类听觉系统的频域掩蔽特性自适应确定小波系数,并通过量化处理过程将水印信息嵌入到小波变换后的听觉重要系数中;最后通过逆整型提升小波变换及音频数据段重新组合得到嵌入水印信息的数字音频作品;并利用嵌入过程的逆过程进行数字水印检测。
申请公布号 CN1224911C 申请公布日期 2005.10.26
申请号 CN03143370.7 申请日期 2003.09.28
申请人 王向阳 发明人 王向阳
分类号 G06F12/14;G06T9/00;G06F7/38;H04N5/911 主分类号 G06F12/14
代理机构 大连东方专利代理有限责任公司 代理人 李洪福
主权项 1、一种基于听觉特性与整型提升小波的数字音频水印嵌入与检测方法,其特征在于包括如下具体步骤:(1)将256级灰度水印图像嵌入到数字音频信号设原始数字音频信号为A={a(i),0≤i<N},其中,N为数据个数,a(i)∈{0,1,2,Λ,(2<sup>p</sup>-1)}是第i个音频数据的幅度值,p为表示每个数据所使用的比特数;设数字水印为256级灰度图像W={w(i,j),0≤i<P,0≤j<Q},其中,w(i,j)代表数字水印图像的第i行、第j列象素的灰度值;数字水印的嵌入过程为:①数字水印图像的压缩编码与置乱加密首先采用基于离散余弦变换的静态图像压缩技术,将数字水印图像W编码为一维的二进制序列V,工作步骤为:(a)将数字水印图像W划分成8×8的图像子块;(b)对每个图像子块进行离散余弦变换,并量化所得到的离散余弦变换系数;于是,可得到压缩编码后的一维二进制序列<maths num="001"><![CDATA[ <math><mrow><mi>V</mi><mo>=</mo><mo>{</mo><mi>v</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>,</mo><mn>0</mn><mo>&le;</mo><mi>k</mi><mo>&lt;</mo><msub><mi>N</mi><mi>w</mi></msub><mo>,</mo><mi>v</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>&Element;</mo><mo>{</mo><mn>0,1</mn><mo>}</mo><mo>,</mo><msub><mi>N</mi><mi>w</mi></msub><mo>=</mo><mfrac><mrow><mn>15</mn><mrow><mo>(</mo><mi>P</mi><mo>&times;</mo><mi>Q</mi><mo>)</mo></mrow></mrow><mn>16</mn></mfrac><mo>}</mo><mo>;</mo></mrow></math>]]></maths>其中,<maths num="002"><![CDATA[ <math><mrow><msub><mi>N</mi><mi>w</mi></msub><mo>=</mo><mfrac><mrow><mi>P</mi><mo>&times;</mo><mi>Q</mi></mrow><mrow><mn>8</mn><mo>&times;</mo><mn>8</mn></mrow></mfrac><mo>&times;</mo><mrow><mo>(</mo><mrow><mo>(</mo><mn>1</mn><mo>+</mo><mn>4</mn><mo>)</mo></mrow><mo>&times;</mo><mn>8</mn><mo>+</mo><mn>5</mn><mo>&times;</mo><mn>4</mn><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mn>15</mn><mrow><mo>(</mo><mi>P</mi><mo>&times;</mo><mi>Q</mi><mo>)</mo></mrow></mrow><mn>16</mn></mfrac><mo>;</mo></mrow></math>]]></maths>然后对上面得到的一维二进制序列V进行置乱加密,得到新的一维二进制序列X={x(k),0≤k<N<sub>w</sub>,x(k)∈{0,1}};②音频信号的分段处理及重要音频段的自适应选取采用对数字音频信号进行分段的方法嵌入水印信息,即首先将整个音频信号划分为若干个音频数据段,进而依据人类听觉系统自适应选取重要音频数据段用于嵌入水印,每个音频段仅嵌入1个比特的水印信息;设每个音频段含有L个数据,为了保证数字水印的透明性与鲁棒性,音频段长度L的取值以大于等于8为宜,则可将整个音频信号划分成N/L个音频段,即        A={A(k),0≤k<N/L},A(k)={a(kL+i),0 ≤i<L};根据听觉时域掩蔽特性,结合音频信号内容选取能量较大的音频段作为水印嵌入的候选段;下面给出基于内容的听觉重要音频段自适应选取方法;首先,计算每个音频段的样本能量E(k)(0≤k<N/L):<maths num="003"><![CDATA[ <math><mrow><mi>E</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>L</mi><mo>-</mo><mn>1</mn></mrow></munderover><msup><mi>a</mi><mn>2</mn></msup><mrow><mo>(</mo><mi>kL</mi><mo>+</mo><mi>i</mi><mo>)</mo></mrow></mrow></math>]]></maths>然后,对所求取的N/L个音频段样本能量值进行降序排序,并选择能量较大的前N<sub>w</sub>个音频段A<sub>e</sub>={A<sub>e</sub>(k),0≤k<N<sub>w</sub>}作为水印嵌入的候选段;③整型提升小波变换及小波系数的选取对所选取的每个音频数据段A<sub>e</sub>(k)(0≤k<N<sub>w</sub>)分别进行3级整型提升小波变换      CD<sub>e</sub>(k)=ILWT<sub>3</sub>(A<sub>e</sub>(k))={C<sub>e</sub>(k)(3),D<sub>e</sub>(k)(3),D<sub>e</sub>(k)(2),D<sub>e</sub>(k)(1)}式中,C<sub>e</sub>(k)(3)为第k音频段A<sub>e</sub>(k)3级小波变换后的逼近信号,而{D<sub>e</sub>(k)(3),D<sub>e</sub>(k)(2),D<sub>e</sub>(k)(1)}为第k音频段A<sub>e</sub>(k)3级小波变换后的细节信号;根据人类听觉系统的频域掩蔽特性,本方法从第k音频段A<sub>e</sub>(k)3级小波变换细节信号D<sub>e</sub>(k)(3)中选取绝对值大的小波系数C(k)用于水印序列元素x(k)的嵌入;④数字水印的嵌入水印嵌入是通过对所选择的小波系数C(k)进行特殊量化完成的;设C(k)表示待量化小波系数,C′(k)表示量化处理后的小波系数,x(k)为待嵌入水印比特,Δ表示量化间隔;将量化间隔选取为基于人类听觉系统而计算出的可感知噪声阈值(JND),即Δ=JND(C(k));则量化修改系数嵌入数字水印过程如下:首先定义量化规则,将量化函数定义为用量化间隔JND(C(k))对待量化小波系数C(k)进行二次取模求余运算,即                Q(C(k))=[C(k)mod(JND(C(k))]mod(2)其量化规则为:如果C(k)mod(JND(C(k))为奇数,则Q(C(k))取1,即C(k)归于1类;如果C(k)mod(JND(C(k))为偶数,则Q(C(k))取0,即C(k)归于0类;然后量化系数嵌入水印信息,即对所选小波系数C(k)进行适当修改并赋予二值信息的过程,所采用的量化嵌入方案为:如果Q(C(k))不等于x(k),则如果x(k)=0,则<img file="C031433700003C1.GIF" wi="1109" he="209" />否则<img file="C031433700003C2.GIF" wi="1064" he="135" />否则不对C(k)做任何处理;其中,<maths num="004"><![CDATA[ <math><mrow><msub><mi>q</mi><mn>1</mn></msub><mo>=</mo><mo>[</mo><mfrac><mrow><mi>C</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow><mrow><mi>JND</mi><mrow><mo>(</mo><mi>C</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>)</mo></mrow></mrow></mfrac><mo>]</mo><mo>,</mo></mrow></math>]]></maths>  <maths num="005"><![CDATA[ <math><mrow><msub><mi>q</mi><mn>2</mn></msub><mo>=</mo><mo>[</mo><mfrac><mrow><mi>C</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow><mrow><mi>JND</mi><mrow><mo>(</mo><mi>C</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>)</mo></mrow></mrow></mfrac><mo>]</mo></mrow></math>]]></maths>⑤整型提升小波逆变换及音频段的重新组合为了得到含水印的数字音频信号,要对含有水印信息的小波系数进行3级整型提升小波逆变换,即用含有水印信息的小波系数C′(k)代替C(k)并对小波系数CD<sub>e</sub>′进行3级整型提升小波逆变换,即            A<sub>e</sub>′=IILWT<sub>3</sub>(CD<sub>e</sub>′)将A<sub>e</sub>′代替A<sub>e</sub>,再结合未被选用的音频数据段,即可最终得到含有水印的数字音频信号A′;数字水印的检测过程如下:①将待检测数字音频信号A′划分成N/L个音频段,根据水印嵌入过程所生成的候选段位置信息选择听觉重要音频数据段A<sub>e</sub>′={A<sub>e</sub>′(k),0≤k<N<sub>w</sub>}并对其分别进行3级整型提升小波变换;②根据嵌入水印过程中所生成的用于嵌入水印的小波系数位置信息,确定出含有水印序列元素x′(k)信息的小波系数C′(k)(k=0,1,Λ,N<sub>w</sub>-1),并利用前面所定义的量化规则提取水印,即<img file="C031433700004C1.GIF" wi="848" he="130" />③按照数字水印嵌入算法的相反操作,对数字水印信息X′进行逆置乱加密,以得到原始水印的一维二进制序列V′={v′(k),0≤k<N<sub>w</sub>,v′(k)∈{0,1}};④对所得到的一维二进制序列V′进行解压缩,便可恢复嵌入的数字水印图像W′={w′(i,j),0≤i<P,0≤j<Q}。(2)将24位真彩色水印图像嵌入到数字音频信号设原始数字音频信号为A={a(i),0≤i<N},其中,N为数据个数,a(i)∈{0,1,2,Λ,(2<sup>p</sup>-1)}是第i个音频数据的幅度值,p为表示每个数据所使用的比特数;设数字水印为24位真彩色图像W={w(i,j),0≤i<P,0≤j<Q},其中,w(i,j)代表数字水印图像的第i行、第j列象素的颜色值;数字水印的嵌入过程为:①数字水印图像的压缩编码与置乱加密首先采用基于离散余弦变换的静态图像压缩技术,将数字水印图像W编码为一维的二进制序列V,工作步骤为:(a)将彩色水印图像W分解为R、G、B三个彩色分量;(b)将彩色分量R划分成8×8的子块;(c)对每个子块进行离散余弦变换,并量化所得到的离散余弦变换系数;于是,可得到压缩编码后的一维二进制序列<maths num="006"><![CDATA[ <math><mrow><msub><mi>V</mi><mi>R</mi></msub><mo>=</mo><mo>{</mo><msup><mi>v</mi><mi>R</mi></msup><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>,</mo><mn>0</mn><mo>&le;</mo><mi>k</mi><mo>&lt;</mo><msubsup><mi>N</mi><mi>w</mi><mo>&prime;</mo></msubsup><mo>,</mo><msup><mi>v</mi><mi>R</mi></msup><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>&Element;</mo><mo>{</mo><mn>0,1</mn><mo>}</mo><mo>,</mo><msubsup><mi>N</mi><mi>w</mi><mo>&prime;</mo></msubsup><mo>=</mo><mfrac><mrow><mn>15</mn><mrow><mo>(</mo><mi>P</mi><mo>&times;</mo><mi>Q</mi><mo>)</mo></mrow></mrow><mn>16</mn></mfrac><mo>;</mo></mrow></math>]]></maths>其中,<maths num="007"><![CDATA[ <math><mrow><msubsup><mi>N</mi><mi>w</mi><mo>&prime;</mo></msubsup><mo>=</mo><mfrac><mrow><mi>P</mi><mo>&times;</mo><mi>Q</mi></mrow><mrow><mn>8</mn><mo>&times;</mo><mn>8</mn></mrow></mfrac><mo>&times;</mo><mrow><mo>(</mo><mrow><mo>(</mo><mn>1</mn><mo>+</mo><mn>4</mn><mo>)</mo></mrow><mo>&times;</mo><mn>8</mn><mo>+</mo><mn>5</mn><mo>&times;</mo><mn>4</mn><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mn>15</mn><mrow><mo>(</mo><mi>P</mi><mo>&times;</mo><mi>Q</mi><mo>)</mo></mrow></mrow><mn>16</mn></mfrac><mo>;</mo></mrow></math>]]></maths>(d)对于彩色分量G、B实施步骤(b)和(c)的相同操作,即可得到水印图像W的压缩编码后一维二进制序列V={v(k),0≤k<N<sub>w</sub>,N<sub>w</sub>=3N<sub>w</sub>′,v(k)∈{0,1}};然后对上面得到的一维二进制序列V进行置乱加密,得到新的一维二进制序列X={x(k),0≤k<N<sub>w</sub>,x(k)∈{0,1}};②音频信号的分段处理及重要音频段的自适应选取采用对数字音频信号进行分段的方法嵌入水印信息,即首先将整个音频信号划分为若干个音频数据段,进而依据人类听觉系统自适应选取重要音频数据段用于嵌入水印,每个音频段仅嵌入1个比特的水印信息;设每个音频段含有L个数据,为了保证数字水印的透明性与鲁棒性,音频段长度L的取值以大于等于8为宜,则可将整个音频信号划分成N/L个音频段,即        A={A(k),0≤k<N/L},A(k)={a(kL+i),0≤i<L};根据听觉时域掩蔽特性,结合音频信号内容选取能量较大的音频段作为水印嵌入的候选段;下面给出基于内容的听觉重要音频段自适应选取方法;首先,计算每个音频段的样本能量E(k)(0≤k<N/L):<maths num="008"><![CDATA[ <math><mrow><mi>E</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>L</mi><mo>-</mo><mn>1</mn></mrow></munderover><msup><mi>a</mi><mn>2</mn></msup><mrow><mo>(</mo><mi>kL</mi><mo>+</mo><mi>i</mi><mo>)</mo></mrow></mrow></math>]]></maths>然后,对所求取的N/L个音频段样本能量值进行降序排序,并选择能量较大的前N<sub>w</sub>个音频段A<sub>e</sub>={A<sub>e</sub>(k),0≤k<N<sub>w</sub>}作为水印嵌入的候选段;③整型提升小波变换及小波系数的选取对所选取的每个音频数据段A<sub>e</sub>(k)(0≤k<N<sub>w</sub>)分别进行3级整型提升小波变换      CD<sub>e</sub>(k)=ILWT<sub>3</sub>(A<sub>e</sub>(k))={C<sub>e</sub>(k)(3),D<sub>e</sub>(k)(3),D<sub>e</sub>(k)(2),D<sub>e</sub>(k)(1)}式中,C<sub>e</sub>(k)(3)为第k音频段A<sub>e</sub>(k)3级小波变换后的逼近信号,而{D<sub>e</sub>(k)(3),D<sub>e</sub>(k)(2),D<sub>e</sub>(k)(1)}为第k音频段A<sub>e</sub>(k)3级小波变换后的细节信号;根据人类听觉系统的频域掩蔽特性,本方法从第k音频段A<sub>e</sub>(k)3级小波变换细节信号D<sub>e</sub>(k)(3)中选取绝对值大的小波系数C(k)用于水印序列元素x(k)的嵌入;④数字水印的嵌入水印嵌入是通过对所选择的小波系数C(k)进行特殊量化完成的;设C(k)表示待量化小波系数,C′(k)表示量化处理后的小波系数,x(k)为待嵌入水印比特,Δ表示量化间隔;将量化间隔选取为基于人类听觉系统而计算出的可感知噪声阈值(JND),即Δ=JND(C(k));则量化修改系数嵌入数字水印过程如下:首先定义量化规则,将量化函数定义为用量化间隔JND(C(k))对待量化小波系数C(k)进行二次取模求余运算,即                 Q(C(k))=[C(k)mod(JND(C(k))]mod(2)其量化规则为:如果C(k)mod(JND(C(k))为奇数,则Q(C(k))取1,即C(k)归于1类;如果C(k)mod(JND(C(k))为偶数,则Q(C(k))取0,即C(k)归于0类;然后量化系数嵌入水印信息,即对所选小波系数C(k)进行适当修改并赋予二值信息的过程,所采用的量化嵌入方案为:如果Q(C(k))不等于x(k),则如果x(k)=0,则<img file="C031433700006C1.GIF" wi="1108" he="209" />否则<img file="C031433700006C2.GIF" wi="1063" he="136" />否则不对C(k)做任何处理;其中,<img file="C031433700006C3.GIF" wi="383" he="130" /><img file="C031433700006C4.GIF" wi="359" he="129" />⑤整型提升小波逆变换及音频段的重新组合为了得到含水印的数字音频信号,要对含有水印信息的小波系数进行3级整型提升小波逆变换,即用含有水印信息的小波系数C′(k)代替C(k)并对小波系数CD<sub>e</sub>′进行3级整型提升小波逆变换,即                    A<sub>e</sub>′=IILWT<sub>3</sub>(CD<sub>e</sub>′)将A<sub>e</sub>′代替A<sub>e</sub>,再结合未被选用的音频数据段,即可最终得到含有水印的数字音频信号A′;数字水印的检测过程如下:①将待检测数字音频信号A′划分成N/L个音频段,根据水印嵌入过程所生成的候选段位置信息选择听觉重要音频数据段A<sub>e</sub>′={A<sub>e</sub>′(k),0≤k<N<sub>w</sub>}并对其分别进行3级整型提升小波变换;②根据嵌入水印过程中所生成的用于嵌入水印的小波系数位置信息,确定出含有水印序列元素x′(k)信息的小波系数C′(k)(k=0,1,Λ,N<sub>w</sub>-1),并利用前面所定义的量化规则提取水印,即<img file="C031433700006C5.GIF" wi="845" he="129" />③按照数字水印嵌入算法的相反操作,对数字水印信息X′进行逆置乱加密,以得到原始水印的一维二进制序列V′={v′(k),0≤k<N<sub>w</sub>,v′(k)∈{0,1}};④对所得到的一维二进制序列V′进行解压缩,便可恢复嵌入的数字水印图像W′={w′(i,j),0≤i<P,0≤j<Q}。
地址 116029辽宁省大连市辽宁师范大学计算机与信息技术学院