发明名称 一种快速且适用于高维网络的因果骨架构建方法
摘要 本发明实施例公开了一种快速且适用于高维网络的因果骨架构建方法,包括基于最大相关性和最小冗余度的父亲特征选择方法、基于条件独立性测试的因果关系剔除及方向推断方法。采用本发明,在进行条件独立性测试的时候,约简了条件集的规模,使得算法能够快速地找到相应的条件独立性测试,一方面提高算法运行速度,另一方面在条件独立性测试过程中,非父亲节点对算法准确率并没有影响。
申请公布号 CN106156860A 申请公布日期 2016.11.23
申请号 CN201610451558.0 申请日期 2016.06.20
申请人 韩山师范学院 发明人 洪英汉;郭才;林浩岳;陈洪财
分类号 G06N99/00(2010.01)I 主分类号 G06N99/00(2010.01)I
代理机构 广州三环专利代理有限公司 44202 代理人 张泽思;周增元
主权项 一种快速且适用于高维网络的因果骨架构建方法,其特征在于,包括基于最大相关性和最小冗余度的父亲特征选择方法、基于条件独立性测试的因果关系剔除及方向推断方法;所述基于最大相关性和最小冗余度的父亲特征选择方法包括以下步骤:步骤S11,输入关于因果关系无向图G的n维数据集X={x<sub>1</sub>,x<sub>2</sub>,…,x<sub>n</sub>},并初始化y的候选父亲节点集S<sub>y</sub>={};步骤S12,找出X中与y有最大相关性的节点x<sub>k</sub>,S<sub>y</sub>=S<sub>y</sub>∪x<sub>k</sub>;步骤S13,根据最大依赖性、最小冗余度原则,通过<maths num="0001"><math><![CDATA[<mrow><msup><msub><mi>S</mi><mi>y</mi></msub><mo>&prime;</mo></msup><mo>=</mo><mi>arg</mi><munder><mi>max</mi><mrow><msub><mi>x</mi><mi>i</mi></msub><mo>&Element;</mo><mi>X</mi><mo>/</mo><msub><mi>S</mi><mrow><mi>k</mi><mo>-</mo><mn>1</mn></mrow></msub></mrow></munder><mo>&lsqb;</mo><mi>I</mi><mrow><mo>(</mo><mi>y</mi><mo>;</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>-</mo><mfrac><mn>1</mn><mrow><mi>k</mi><mo>-</mo><mn>1</mn></mrow></mfrac><munder><mo>&Sigma;</mo><mrow><msub><mi>x</mi><mi>j</mi></msub><mo>&Element;</mo><msub><mi>S</mi><mrow><mi>k</mi><mo>-</mo><mn>1</mn></mrow></msub></mrow></munder><mi>I</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>;</mo><msub><mi>x</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>&rsqb;</mo></mrow>]]></math><img file="FDA0001022872460000011.GIF" wi="1166" he="175" /></maths>求出后面的特征父亲节点,并按顺序加入候选父亲节点集S<sub>y</sub>,其中y为目标变量,S<sub>y</sub>′为候选特征集,任意变量x<sub>i</sub>,x<sub>j</sub>属于S<sub>y</sub>′,I是互信息;步骤S14,给定1个值m,直接取S中的前m个作为y的候选父亲节点,设定m=n<sup>(1/2)</sup>+1;步骤S15,以x为目标节点,重复步骤S11‑S14求出x的候选父亲节点集S<sub>x</sub>;步骤S16,通过S11‑S15得到的S<sub>x</sub>与S<sub>y</sub>,则x,y候选父亲节点的并集S<sub>x,y</sub>=S<sub>x</sub>∪S<sub>y</sub>;所述基于条件独立性测试的因果关系剔除及方向推断方法包括以下步骤:步骤S21,对n维数据集X中任意1个节点x<sub>i</sub>,设x<sub>i</sub>=y,初始化y的因果节点集P<sub>A</sub>(y)={};步骤S22,求出y的父亲节点,在剩下的X/x<sub>j</sub>的n‑1节点中,遍历式选取任意节点x<sub>j</sub>;步骤S23,通过条件独立性测试,如果存在任意节点集S,S属于S<sub>x,y</sub>使得x<sub>i</sub>┴y|S,则x<sub>i</sub>不是y的因果节点,选取X/x<sub>j</sub>,x<sub>i</sub>重复步骤S22‑S24,如果不存在这样的S,则x<sub>i</sub>是y的因果节点,将x<sub>i</sub>加入P<sub>A</sub>(y);步骤S24,重复步骤S21‑S24直到X中每一个节点都找到其因果节点集,则得到1个完整的因果网络骨架。
地址 521000 广东省潮州市湘桥区桥东韩山师范学院科研处