发明名称 一种拒绝率可控的Metropolis-Hastings图抽样算法
摘要 本发明公开一种拒绝率可控的Metropolis-Hastings算法,首先在图上随机游动采集样本;其次,根据采集得到的样本构造无偏估计。能够有效地解决从一个“隐藏”的在线社交网络中提取均匀样本的问题。该方法很好地平衡了RW算法的“大偏差”问题,以及MH算法的“样本拒绝”问题,该算法适用性非常广泛,如社交网络分析,图数据管理、和图数据挖掘等相关技术领域。
申请公布号 CN104391972A 申请公布日期 2015.03.04
申请号 CN201410736392.8 申请日期 2014.12.05
申请人 深圳大学 发明人 李荣华;蔡涛涛;毛睿;秦璐;金檀;邱宇轩
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 深圳市兴科达知识产权代理有限公司 44260 代理人 王翀
主权项 一种拒绝率可控的Metropolis‑Hastings图抽样算法,包含以下步骤:S1、在图上随机游动采集样本,得到的样本点集S;在图中随机选择节点u设为初始节点,并且将节点u加入点集S,从节点u的邻接节点中等概率随机选取一个节点v,并生成一个均匀分布的概率值q∈[0,1];如果q≤(d<sub>u</sub>/d<sub>v</sub>)<sup>α</sup>则将节点v作为下一步的节点u,并将节点v加入点集S,否则不做任何操作;S2、根据采集得到的样本构造无偏估计,并通过以下公式构造无偏估计:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>E</mi><msup><mi>&pi;</mi><mi>rcmh</mi></msup></msub><mrow><mo>(</mo><mi>f</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mi>&Sigma;</mi><mrow><mi>u</mi><mo>&Element;</mo><mi>S</mi></mrow></msub><mi>f</mi><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><msup><mi>w</mi><mi>rcmh</mi></msup><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow></mrow><mrow><msub><mi>&Sigma;</mi><mrow><mi>u</mi><mo>&Element;</mo><mi>S</mi></mrow></msub><msup><mi>w</mi><mi>rcmh</mi></msup><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow></mrow></mfrac></mrow>]]></math><img file="FDA0000625677340000011.GIF" wi="612" he="166" /></maths>其中,<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msup><mi>w</mi><mi>rcmh</mi></msup><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>=</mo><msubsup><mi>d</mi><mi>u</mi><mrow><mo>(</mo><mi>&alpha;</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>.</mo></mrow>]]></math><img file="FDA0000625677340000012.GIF" wi="359" he="82" /></maths>
地址 518000 广东省深圳市南山区南海大道3688号