发明名称 贝叶斯算法和MapReduce相结合的信任度量方法
摘要 本发明涉及一种贝叶斯算法和MapReduce相结合的信任度量方法,包括以下步骤:S01:采用贝叶斯过滤算法对移动终端交互中产生的行为记录进行信任度评估,通过统计训练数据集中的先验概率,利用贝叶斯公式计算出其后验概率,选择最大后验概率作为行为记录的信任度;S02:运用带Dirichlet过程的贝叶斯推理算法对可信记录做概率分布评估,得到对移动终端的可信度预测;S03:采用信息增益算法实现特征值的选取。本发明借助云计算平台在信任度计算与存储过程中具有的高效性、安全性与中立性,保证数据的安全存储与高性能计算。
申请公布号 CN103455842B 申请公布日期 2015.06.03
申请号 CN201310397770.X 申请日期 2013.09.04
申请人 福州大学 发明人 郑相涵;徐凌珊;陈哲毅;郭文忠;陈国龙
分类号 G06N3/00(2006.01)I;H04L29/08(2006.01)I 主分类号 G06N3/00(2006.01)I
代理机构 福州元创专利商标代理有限公司 35100 代理人 蔡学俊
主权项 一种贝叶斯算法和MapReduce相结合的信任度量方法,其特征在于,包括以下步骤:S01:采用贝叶斯过滤算法对移动终端交互中产生的行为记录进行信任度评估,通过统计训练数据集中的先验概率,利用贝叶斯公式计算出其后验概率,选择最大后验概率作为行为记录的信任度;S02:运用带Dirichlet过程的贝叶斯推理算法对可信记录做概率分布评估,得到对移动终端的可信度预测;S03:采用信息增益算法实现特征值的选取;所述步骤S01采用基于多变量的伯努利事件模型对行为记录分解所得的属性词集进行处理;所述步骤S02中,每个可信记录被划分为5个级别:完全信任,比较信任,一般信任,不大信任,不信任,并且每条可信记录由贝叶斯过滤器划分到这五个级别;贝叶斯公式中P(B<sub>i</sub>|A)表示求行为记录A出现的概率下是B<sub>i</sub>分类的概率,B<sub>i</sub>的分类为可信记录B<sub>1</sub>和不可信记录B<sub>2</sub>,即贝叶斯公式中的后验概率,先验概率P(B<sub>i</sub>)通过统计训练数据获得,似然概率P(A|B<sub>i</sub>)转换为属性词与分类的关系计算,用x<sub>k</sub>(k=1,2...m)表示行为记录A的属性词,w<sub>k</sub>为属性词x<sub>k</sub>在行为记录A中出现的情况,w<sub>k</sub>=1表示属性词出现,w<sub>k</sub>=0表示属性词不出现;则有:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>P</mi><mrow><mo>(</mo><mi>A</mi><mo>|</mo><msub><mi>B</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Pi;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mi>P</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>k</mi></msub><mo>|</mo><msub><mi>B</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>+</mo><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msub><mi>w</mi><mi>k</mi></msub><mo>)</mo></mrow><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mi>P</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>k</mi></msub><mo>|</mo><msub><mi>B</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000693453260000011.GIF" wi="1101" he="130" /></maths>其中当x<sub>k</sub>出现的概率为P(x<sub>k</sub>|B<sub>i</sub>),x<sub>k</sub>不出现的概率为(1‑P(x<sub>k</sub>|B<sub>i</sub>)),那么得:<img file="FDA0000693453260000012.GIF" wi="970" he="151" />由于B<sub>i</sub>的分类为二值分类,因此对P(x<sub>k</sub>|B<sub>i</sub>)作平滑处理得<img file="FDA0000693453260000013.GIF" wi="1074" he="151" />再根据全概率公式P(A)=P(B<sub>1</sub>)P(A|B<sub>1</sub>)+(1‑P(B<sub>1</sub>))P(A|B<sub>2</sub>),获得行为记录A出现的概率,联立以上式子得到行为记录信任度的解。
地址 350108 福建省福州市闽侯县上街镇大学城学园路2号福州大学新区