发明名称 一种MFCC水下目标特征提取和识别方法
摘要 一种MFCC水下目标特征提取和识别方法,包括步骤:1)获取数据序列x(n);2)进行分帧处理得到x<sub>i</sub>(n);3)通过加窗操作得到y<sub>i</sub>(n);4)计算分帧加窗信号的单边功率谱密度p<sub>i</sub>(l);5)求解三角滤波器组的传递函数H<sub>m</sub>(f),通过三角滤波器组得到Q;6)进行对数变换得到E;7)分别进行t方向和f方向的Sobel算子和拉普拉斯算子3×3的模板块运算得到A、B和C;8)分别进行DCT变换得到特征集C<sub>A</sub>,C<sub>B</sub>,C<sub>C</sub>,组合特征;9)通过基于EM算法的混合高斯模型的聚类分类器进行水下目标识别。本方法利有利于提高水下目标的识别率。
申请公布号 CN102799892B 申请公布日期 2015.04.01
申请号 CN201210194530.5 申请日期 2012.06.13
申请人 东南大学 发明人 曹红丽;方世良
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 南京天翼专利代理有限责任公司 32112 代理人 朱戈胜
主权项 一种MFCC水下目标特征提取和识别方法,其特征在于,步骤包括:首先,对水下目标信号即舰船辐射噪声信号分别进行分帧加窗的单边功率谱求取;接下来,求解基于Mel频率的三角滤波器的频域传递函数;然后,将水下目标信号的功率谱与三角滤波器组相乘并进行对数变化,经过t方向和f方向的Sobel算子和拉普拉斯算子运算;最后,进行DCT变化去除特征间的相关性,设计基于EM算法的混合高斯模型的聚类分类器;本方法具体包括以下步骤:第一步:获取舰船辐射噪声信号对应的数据序列x(n):接收长度为N的实时采集数据,或提取N点存储的现成数据作为待处理的数据序列x(n),n=0,1,…N‑1,数据的采样率为f<sub>s</sub>;第二步:进行分帧处理得到x<sub>i</sub>(n):对第一步的数据序列x(n)进行分帧处理,得到每一帧数据序列x<sub>i</sub>(n),其中,x<sub>i</sub>(n)=x(n+id)          式(1)在式(1)中,n=0,1,…L‑1,i=0,1,…K‑1,<img file="FDA0000587441610000011.GIF" wi="444" he="146" /><img file="FDA0000587441610000012.GIF" wi="72" he="74" />表示向下取整运算;L表示x<sub>i</sub>(n)的数据长度,d表示帧之间的重复数据数目,K表示帧的数目;第三步:通过加窗操作得到y<sub>i</sub>(n):对每一帧数据序列x<sub>i</sub>(n)(i=0,1,…K‑1)进行加窗处理,得到y<sub>i</sub>(n),其中,y<sub>i</sub>(n)=x<sub>i</sub>(n)w(n)        式(2)在式(2)中,i=0,1,…K‑1,n=0,1,…L‑1,w(n)=0.54‑0.46cos(2πn/L),;w(n)表示窗函数;第四步:计算分帧加窗信号的单边功率谱密度p<sub>i</sub>(l):对数据序列y<sub>i</sub>(n)求解单边功率谱密度p<sub>i</sub>(l),其中,<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>p</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow><mo>=</mo><msup><mrow><mo>|</mo><munderover><mi>&Sigma;</mi><mrow><mi>n</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>L</mi><mo>-</mo><mn>1</mn></mrow></munderover><msub><mi>y</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mi>exp</mi><mo>{</mo><mo>-</mo><mi>j</mi><mn>2</mn><mi>&pi;nl</mi><mo>/</mo><mi>L</mi><mo>}</mo><mo>|</mo></mrow><mn>2</mn></msup></mrow>]]></math><img file="FDA0000587441610000021.GIF" wi="719" he="161" /></maths>     式(3)在式(3)中,l=0,1,…L/2+1,||表示绝对值运算,j表示虚数单位,即<img file="FDA0000587441610000022.GIF" wi="203" he="83" />i=0,1,2,…,K‑1;第五步:求解三角滤波器组的传递函数H<sub>m</sub>(l),通过三角滤波器组得到Q,其中,Q表示运算的结果,无特指含义:求解三角滤波器组在频域的传递函数H<sub>m</sub>(l),从第四步的分帧的单边功率谱密度p<sub>i</sub>(l)通过三角滤波器组得到Q,其中,<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>Q</mi><mrow><mo>(</mo><mi>m</mi><mo>,</mo><mi>i</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>l</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>L</mi><mo>/</mo><mn>2</mn><mo>+</mo><mn>1</mn></mrow></munderover><msub><mi>H</mi><mi>m</mi></msub><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow><msub><mi>p</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000587441610000023.GIF" wi="544" he="147" /></maths>      式(4)在式(4)中,H<sub>m</sub>(l)表示三角滤波器的传递函数,l=0,1,…L/2+1;i=0,1,…K‑1;将范围在(0,f<sub>s</sub>/2)的频率f均等分成L/2+1个频率点,按照式(5)计算Mel频率值mel=2595log(1+f/700)        式(5)将mel均等分成M+2个Mel频率值,mel的取值范围在(0,2595log(1+f<sub>s</sub>/700)),依次对每个Mel频率值找f中对应最接近的频率值点,组成[f(0),f(2),…f(m),…f(M+1)],按照式(6)计算H<sub>m</sub>(f),将H<sub>m</sub>(f)中的f按照序号表示,得到H<sub>m</sub>(l),l=0,1,…L/2+1,<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>H</mi><mi>m</mi></msub><mrow><mo>(</mo><mi>f</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mn>0</mn><mo>,</mo><mi>f</mi><mo>&lt;</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mfrac><mrow><mn>2</mn><mrow><mo>(</mo><mi>f</mi><mo>-</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>)</mo></mrow></mrow><mrow><mrow><mo>(</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>-</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>)</mo></mrow><mrow><mo>(</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>)</mo></mrow><mo>-</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>)</mo></mrow></mrow></mfrac><mo>,</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>&le;</mo><mi>f</mi><mo>&lt;</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mfrac><mrow><mn>2</mn><mrow><mo>(</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>-</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>)</mo></mrow><mo>)</mo></mrow></mrow><mrow><mrow><mo>(</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>-</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>)</mo></mrow><mrow><mo>(</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>-</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>)</mo></mrow><mo>)</mo></mrow></mrow></mfrac><mo>,</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>)</mo></mrow><mo>&le;</mo><mi>f</mi><mo>&lt;</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mn>0</mn><mo>,</mo><mi>f</mi><mo>&GreaterEqual;</mo><mi>f</mi><mrow><mo>(</mo><mi>m</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000587441610000024.GIF" wi="1519" he="509" /></maths>   式(6)在式(5)(6)中,m=1,2,…M,M表示三角滤波器的个数;第六步:进行对数变换得到E:对Q进行对数变化得到E,其中,E(m,i)=log(Q(m,i))        式(7)在式(7)中,将E(m,i)小于1的置为1;m=1,2,…M,i=0,1,…K‑1;第七步:分别进行t方向和f方向的Sobel算子和拉普拉斯算子3×3的模板块运算得到A,B和C,其中A,B和C是运算得到的结果,无特指含义:将E通过3×3的模板块运算得到A,B和C,其中,<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><mi>U</mi><mrow><mo>(</mo><mi>m</mi><mo>,</mo><mi>i</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>T</mi><mo>,</mo><mi>T</mi><mo>=</mo><mo>-</mo><mn>1</mn></mrow><mn>1</mn></munderover><mi>E</mi><mrow><mo>(</mo><mi>m</mi><mo>+</mo><mi>T</mi><mo>,</mo><mi>i</mi><mo>+</mo><mi>F</mi><mo>)</mo></mrow><msub><mi>d</mi><mi>U</mi></msub><mrow><mo>(</mo><mi>T</mi><mo>,</mo><mi>F</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000587441610000031.GIF" wi="826" he="150" /></maths>      式(8)在式(8)中,U的第一行、最后一行、第一列和最后一列不做变换,U的其余行和列按照式(6)计算,d<sub>U</sub>表示Sobel算子和拉普拉斯算子3×3的模板,U=A,B,C;m=1,2,…M,i=0,1,…K‑1;第八步:分别进行DCT变换得到特征集C<sub>A</sub>,C<sub>B</sub>,C<sub>C</sub>,组合特征D:将第七步中得到的A,B和C进行离散余弦变换分别得到C<sub>A</sub>,C<sub>B</sub>,C<sub>C</sub>,并对C<sub>A</sub>,C<sub>B</sub>,C<sub>C</sub>按列取平均得到D<sub>A</sub>,D<sub>B</sub>,D<sub>C</sub>,最后拼接成组合特征D,其中,<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msub><mi>C</mi><mi>U</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>,</mo><mi>i</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>m</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><mi>U</mi><mrow><mo>(</mo><mi>m</mi><mo>,</mo><mi>i</mi><mo>)</mo></mrow><mi>cos</mi><mo>{</mo><mi>&pi;</mi><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>0.5</mn><mo>)</mo></mrow><mi>n</mi><mo>/</mo><mi>M</mi><mo>}</mo></mrow>]]></math><img file="FDA0000587441610000032.GIF" wi="892" he="149" /></maths>      式(9)<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><msub><mi>D</mi><mi>U</mi></msub><mo>=</mo><mfrac><mn>1</mn><mi>K</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mi>C</mi><mi>U</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>,</mo><mi>i</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000587441610000033.GIF" wi="412" he="142" /></maths>      式(10)在式(9)(10)中,n=1,2,…p,p表示每一帧数据的特征数目;U=A,B,C,i=0,1,…K‑1;第九步:通过基于EM算法的混合高斯模型的聚类分类器进行水下目标识别。
地址 211189 江苏省南京市江宁开发区东南大学路2号