发明名称 基于密度的欠定盲源分离方法
摘要 本发明公开了一种基于密度的欠定盲源分离方法,主要解决现有技术计算复杂度高,易受初始值影响,需给定源信号个数的问题。其实现步骤是:对观测信号去掉低能量采样数据后投影到单位右半超球面上;计算所有投影点的密度参数,删除密度较小的投影点;利用改进的K-均值聚类算法对剩余投影点进行聚类,确定最佳聚类个数和聚类中心;去掉包含数据对象个数很少的聚类,剩余聚类个数为源信号个数的估计值,对应的聚类中心为混合矩阵各个列矢量的估计值;根据观测信号和估计出的混合矩阵,采用线性规划法恢复源信号。本发明降低了计算复杂度,减小了初始值对估计性能的影响,能在源信号个数未知时估计出混合矩阵,可提高混合矩阵和源信号的估计精度。
申请公布号 CN103218524A 申请公布日期 2013.07.24
申请号 CN201310116467.8 申请日期 2013.04.03
申请人 西安电子科技大学 发明人 付卫红;马丽芬;曾兴雯;严新;李爱丽;刘乃安;黑永强;李晓辉
分类号 G06F19/00(2011.01)I 主分类号 G06F19/00(2011.01)I
代理机构 陕西电子工业专利中心 61205 代理人 王品华;朱红星
主权项 1.一种基于密度的欠定盲源分离方法,其特征在于,包括如下步骤:1)在所有采样时刻t处,将接收端接收到的观测信号x(t)的能量<img file="FDA00003010664400011.GIF" wi="139" he="85" />与低能量门限ε<sub>1</sub>进行比较,如果<img file="FDA00003010664400012.GIF" wi="246" he="82" />则将x(t)删除,否则将x(t)投影到单位右半超球面上,得到投影点<img file="FDA000030106644000119.GIF" wi="102" he="61" /><maths num="0001"><![CDATA[<math><mrow><mover><mi>x</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mi>sign</mi><mrow><mo>(</mo><msub><mi>x</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>&times;</mo><mi>x</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>/</mo><msub><mrow><mo>|</mo><mo>|</mo><mi>x</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msub><mo>,</mo></mrow></math>]]></maths>其中,x(t)为采样时刻t处的观测信号,t=1,2,…,T<sub>0</sub>,T<sub>0</sub>为采样数据长度,x<sub>1</sub>(t)为观测信号x(t)的第一个分量,sign(·)表示求变量的符号,||·||<sub>2</sub>表示2范数,ε<sub>1</sub>的取值范围为观测信号能量平均值的0.1~0.5倍;2)将步骤1)得到的所有投影点重新排列成下标连续且递增的形式:<img file="FDA00003010664400014.GIF" wi="276" he="70" />得到投影点集合<img file="FDA000030106644000120.GIF" wi="620" he="105" />计算投影点集合<img file="FDA00003010664400016.GIF" wi="52" he="64" />中任意数据对象<img file="FDA00003010664400017.GIF" wi="49" he="62" />的密度参数<img file="FDA00003010664400018.GIF" wi="162" he="65" /><maths num="0002"><![CDATA[<math><mrow><msub><mi>B</mi><mi>r</mi></msub><mrow><mo>(</mo><msub><mover><mi>x</mi><mo>~</mo></mover><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mi>&Sigma;u</mi><mrow><mo>(</mo><mi>r</mi><mo>-</mo><mi>d</mi><mrow><mo>(</mo><msub><mover><mi>x</mi><mo>~</mo></mover><mi>i</mi></msub><mo>,</mo><msub><mover><mi>x</mi><mo>~</mo></mover><mi>j</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow><mi>i</mi><mo>,</mo><mi>j</mi><mo>=</mo><mn>1</mn><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><mi>n</mi><mo>,</mo></mrow></math>]]></maths>其中,M为观测信号个数,n为投影点集合<img file="FDA000030106644000110.GIF" wi="48" he="62" />中数据对象个数,且n≤T<sub>0</sub>,<img file="FDA000030106644000111.GIF" wi="186" he="73" />为投影点集合<img file="FDA000030106644000112.GIF" wi="51" he="66" />中任意两个数据对象<img file="FDA000030106644000113.GIF" wi="57" he="63" />和<img file="FDA000030106644000114.GIF" wi="56" he="70" />之间的欧式距离,r为数据对象的邻域半径:<maths num="0003"><![CDATA[<math><mrow><mi>r</mi><mo>=</mo><mfrac><mn>1</mn><mi>n</mi></mfrac><mo>&times;</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mi>min</mi><mrow><mo>(</mo><mi>d</mi><mrow><mo>(</mo><msub><mover><mi>x</mi><mo>~</mo></mover><mi>i</mi></msub><mo>,</mo><msub><mover><mi>x</mi><mo>~</mo></mover><mi>j</mi></msub><mo>)</mo></mrow><mo></mo></mrow><mi>j</mi><mo>=</mo><mn>1</mn><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><mi>n</mi><mo>,</mo><mi>i</mi><mo>&NotEqual;</mo><mi>j</mi><mo>,</mo></mrow></math>]]></maths>函数u具体定义为:<maths num="0004"><![CDATA[<math><mrow><mi>u</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mi>x</mi><mo>&GreaterEqual;</mo><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mi>x</mi><mo>&lt;</mo><mn>0</mn></mtd></mtr></mtable></mfenced><mo>,</mo></mrow></math>]]></maths>其中<maths num="0005"><![CDATA[<math><mrow><mi>x</mi><mo>=</mo><mi>r</mi><mo>-</mo><mi>d</mi><mrow><mo>(</mo><msub><mover><mi>x</mi><mo>~</mo></mover><mi>i</mi></msub><mo>,</mo><msub><mover><mi>x</mi><mo>~</mo></mover><mi>j</mi></msub><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>3)设定低密度门限η<sub>1</sub>和高密度门限η<sub>2</sub>,将投影点集合<img file="FDA000030106644000118.GIF" wi="47" he="69" />中数据对象的密度参数<img file="FDA00003010664400021.GIF" wi="138" he="69" />与低密度门限η<sub>1</sub>以及高密度门限η<sub>2</sub>进行比较,删除密度参数<img file="FDA00003010664400022.GIF" wi="218" he="70" />的数据对象,得到剩余投影点集合<img file="FDA000030106644000215.GIF" wi="69" he="65" />保存密度参数<img file="FDA00003010664400024.GIF" wi="218" he="71" />的数据对象,得到高密度数据对象集合D,其中η<sub>1</sub>的值取范围为密度参数最大值的0.01~0.2倍,η<sub>2</sub>的取值范围为密度参数最大值的0.25~0.45倍;4)利用改进的K-均值聚类算法对步骤3)得到的剩余投影点集合<img file="FDA00003010664400025.GIF" wi="42" he="62" />内的数据对象进行聚类划分,得到原始混合矩阵Α的估计值<img file="FDA000030106644000216.GIF" wi="66" he="66" />4.1)选取初始聚类个数K=M,临时变量F<sub>1</sub>=0.001,中间变量F<sub>2</sub>=0.002;4.2)在步骤3)得到的高密度数据对象集合D中选取K个初始聚类中心z<sub>1</sub>,z<sub>2</sub>,…,z<sub>K</sub>;4.3)利用原始K-均值聚类算法将剩余投影点集合<img file="FDA00003010664400027.GIF" wi="42" he="60" />内的数据对象划分为K类,得到K个聚类W<sub>1</sub>…W<sub>i</sub>…W<sub>K</sub>,这些聚类对应的聚类中心分别为<img file="FDA000030106644000217.GIF" wi="272" he="67" />每个聚类中数据对象个数分别为n<sub>1</sub>…n<sub>i</sub>…n<sub>K</sub>,其中i∈[1,K];4.4)利用步骤4.3)得到的聚类W<sub>1</sub>…W<sub>i</sub>…W<sub>K</sub>和聚类中心<img file="FDA000030106644000218.GIF" wi="272" he="65" />计算戴维森堡丁指标值DBI<sub>K</sub>:<maths num="0006"><![CDATA[<math><mrow><msub><mi>DBI</mi><mi>K</mi></msub><mo>=</mo><mfrac><mn>1</mn><mi>K</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><munder><mi>max</mi><mi>j</mi></munder><mfrac><mrow><mfrac><mn>1</mn><msub><mi>n</mi><mi>i</mi></msub></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>p</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><mi>i</mi></msub></munderover><msub><mrow><mo>|</mo><mo>|</mo><msub><mover><mi>x</mi><mo>~</mo></mover><mi>p</mi></msub><mo>-</mo><msub><mover><mi>z</mi><mo>~</mo></mover><mi>i</mi></msub><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msub><mo>+</mo><mfrac><mn>1</mn><msub><mi>n</mi><mi>j</mi></msub></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>q</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><mi>j</mi></msub></munderover><msub><mrow><mo>|</mo><mo>|</mo><msub><mover><mi>x</mi><mo>~</mo></mover><mi>q</mi></msub><mo>-</mo><msub><mover><mi>z</mi><mo>~</mo></mover><mi>j</mi></msub><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msub></mrow><msub><mrow><mo>|</mo><mo>|</mo><msub><mover><mi>z</mi><mo>~</mo></mover><mi>i</mi></msub><mo>-</mo><msub><mover><mi>z</mi><mo>~</mo></mover><mi>j</mi></msub><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msub></mfrac><mi>j</mi><mo>=</mo><mn>1</mn><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><mi>K</mi><mo>,</mo><mi>j</mi><mo>&NotEqual;</mo><mi>i</mi><mo>,</mo></mrow></math>]]></maths>其中,<img file="FDA000030106644000211.GIF" wi="61" he="71" />为聚类W<sub>i</sub>中的数据对象,p=1,…,n<sub>i</sub>,n<sub>i</sub>为聚类W<sub>i</sub>中数据对象个数;<img file="FDA000030106644000212.GIF" wi="56" he="70" />为聚类W<sub>j</sub>中的数据对象,q=1,…,n<sub>j</sub>,n<sub>j</sub>为聚类W<sub>j</sub>中数据对象个数;<img file="FDA000030106644000213.GIF" wi="50" he="62" />和<img file="FDA000030106644000214.GIF" wi="52" he="70" />分别为聚类W<sub>i</sub>和聚类W<sub>j</sub>的聚类中心;4.5)将本次迭代得到的戴维森堡丁指标值DBI<sub>K</sub>与临时变量F<sub>1</sub>和中间变量F<sub>2</sub>进行比较,如果不满足DBI<sub>K</sub>>F<sub>2</sub>且F<sub>2</sub><F<sub>1</sub>,则令聚类个数K=K+1,临时变量F<sub>1</sub>=F<sub>2</sub>,中间变量F<sub>2</sub>=DBI<sub>K</sub>,返回步骤4.2);否则最佳聚类个数为K-1,对应的聚类中心<img file="FDA00003010664400031.GIF" wi="285" he="70" />为最优聚类中心,迭代结束;4.6)设定个数门限ε<sub>2</sub>,计算数据对象个数n<sub>i</sub>与个数最大值Q的比值λ<sub>i</sub>:λ<sub>i</sub>=n<sub>i</sub>/Q,其中i=1,…,K-1,Q=max(n<sub>1</sub>,n<sub>2</sub>,…,n<sub>K-1</sub>),ε<sub>2</sub>的取值为0.2;将比值λ<sub>i</sub>与个数门限ε<sub>2</sub>进行比较,如果λ<sub>i</sub><ε<sub>2</sub>,则删除聚类中心<img file="FDA000030106644000318.GIF" wi="66" he="65" />否则将<img file="FDA00003010664400033.GIF" wi="49" he="67" />作为混合矩阵<img file="FDA00003010664400034.GIF" wi="40" he="60" />的一列,最终保留下来的聚类中心的个数<img file="FDA00003010664400035.GIF" wi="47" he="62" />即为源信号个数N的估计值,混合矩阵<img file="FDA00003010664400036.GIF" wi="45" he="63" />即为原始混合矩阵A的估计值;5)在观测信号x(t)和混合矩阵<img file="FDA00003010664400037.GIF" wi="46" he="65" />的基础上,采用线性规划法恢复各路源信号,得到源信号的估计值<img file="FDA000030106644000319.GIF" wi="102" he="61" />其中t=1,2,…,T<sub>0</sub>,T<sub>0</sub>为采样数据长度,完成欠定条件下的盲源分离。
地址 710071 陕西省西安市太白南路2号