发明名称 一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法
摘要 本发明涉及适用于挖掘移动节点移动轨迹关联规则的Apriori方法,使用迭代方法挖掘对象数据集中所有频繁项集,并记录每个频繁项集的日期,计算每个频繁项集的支持度;利用得出的频繁项集,生成移动节点所有可能的关联移动规则,并计算每条移动规则的置信度和移动节点每条关联移动规则的日期,同时,计算每条关联移动规则的日期加权值;根据移动节点当前轨迹及步骤二生成的关联移动规则,预测移动节点下一个移动轨迹。通过将移动节点移动轨迹的时间属性与空间属性一同作为挖掘对象数据,充分考虑移动轨迹的时间和空间双重属性。相较于传统Apriori方法,本发明提供的Apriori方法适用用于挖掘移动节点移动轨迹关联规则。
申请公布号 CN105224688A 申请公布日期 2016.01.06
申请号 CN201510726496.5 申请日期 2015.10.30
申请人 宁波大学 发明人 郑紫微;金涛
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 宁波诚源专利事务所有限公司 33102 代理人 邓青玲
主权项 一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法,用于对移动节点移动轨迹的关联移动规则进行挖掘,其特征在于:包含如下步骤:步骤一、使用迭代方法挖掘对象数据集中所有频繁项集,并记录每个频繁项集的日期,计算每个频繁项集的支持度;步骤二、利用步骤一得出的频繁项集,生成移动节点所有可能的关联移动规则,并计算每条移动规则的置信度和移动节点每条关联移动规则的日期以及计算每条关联移动规则日期的远近变动因子;同时,根据记录的日期和计算的日期远近变动因子,计算每条关联移动规则的日期加权值TWeight(R),从而得到强关联性移动规则,其中,每条关联移动规则日期对应的远变动因子m和近变动因子n计算公式如下:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>m</mi><mo>=</mo><mfrac><mrow><mo>|</mo><mi>M</mi><mi>a</mi><mi>x</mi><mi>D</mi><mi>a</mi><mi>t</mi><mi>e</mi><mo>-</mo><mfrac><mn>1</mn><mi>K</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mi>RuleDate</mi><mi>k</mi></msub><mo>|</mo></mrow><mrow><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mi>RuleDate</mi><mi>k</mi></msub></mrow></mfrac><mo>,</mo><mi>n</mi><mo>=</mo><mfrac><mrow><mo>|</mo><mi>M</mi><mi>i</mi><mi>n</mi><mi>D</mi><mi>a</mi><mi>t</mi><mi>e</mi><mo>-</mo><mfrac><mn>1</mn><mi>K</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mi>RuleDate</mi><mi>k</mi></msub><mo>|</mo></mrow><mrow><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mi>RuleDate</mi><mi>k</mi></msub></mrow></mfrac><mo>;</mo></mrow>]]></math><img file="FDA0000834659130000011.GIF" wi="1238" he="244" /></maths>每条关联移动规则的日期加权值TWeight(R)计算公式如下:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>T</mi><mi>W</mi><mi>e</mi><mi>i</mi><mi>g</mi><mi>h</mi><mi>t</mi><mrow><mo>(</mo><mi>R</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>R</mi><mi>u</mi><mi>l</mi><mi>e</mi><mi>D</mi><mi>a</mi><mi>t</mi><mi>e</mi><mo>-</mo><msup><mi>MinDate</mi><mi>n</mi></msup></mrow><mrow><msup><mi>MaxDate</mi><mi>m</mi></msup><mo>-</mo><msup><mi>MinDate</mi><mi>n</mi></msup></mrow></mfrac><mo>&CenterDot;</mo><mfrac><mrow><msup><mi>MinDate</mi><mi>n</mi></msup><mo>&CenterDot;</mo><msup><mi>MaxDate</mi><mi>m</mi></msup></mrow><mrow><msup><mi>MaxDate</mi><mi>m</mi></msup><mo>+</mo><msup><mi>MinDate</mi><mi>n</mi></msup></mrow></mfrac><mo>&times;</mo><mn>100</mn><mo>;</mo></mrow>]]></math><img file="FDA0000834659130000012.GIF" wi="1251" he="118" /></maths>其中,RuleDate、MaxDate以及MinData分别表示移动规则的日期、移动轨迹数据集中最近的记录日期与最远的记录日期;m为移动轨迹数据集中的最近记录日期MaxDate的变动因子,即近变动因子;n为移动轨迹数据集中的最远记录日期MinData的变动因子,即远变动因子;K为该移动规则日期RuleDate所在月的总天数,RuleDate<sub>k</sub>表示该月中第k天的日期值;步骤三、根据移动节点当前轨迹及步骤二生成的关联移动规则,预测移动节点下一个移动轨迹:假定当前移动节点的移动轨迹为T:(c<sub>n</sub>,t<sub>n</sub>)→(c<sub>m</sub>,t<sub>m</sub>),遍历所有关联移动规则,如果关联移动规则R包含移动轨迹T则说明关联移动规则R是匹配的移动规则,然后根据下式计算关联移动规则R的匹配度,匹配度越高则越有可能是移动节点下一个移动轨迹:Score(R)=Confidence(R)+TWeight(R)其中,Score(R)为关联移动规则R的匹配度,Confidence(R)为关联移动规则R的置信度,TWeight(R)为关联移动规则R的日期加权值;其中,在步骤一中,将移动节点移动轨迹的时间属性与空间属性一同作为挖掘对象数据,用事务数据库D表示对象数据集,每条事务条目用p<sub>1</sub>,p<sub>2</sub>,…p<sub>n‑2</sub>,p<sub>n‑1</sub>,p<sub>n</sub>表示,其中p<sub>n</sub>={(c<sub>n</sub>,t<sub>n</sub>)||c<sub>n</sub>∈C,t<sub>n</sub>∈T},代表移动节点在时间点t<sub>n</sub>接入了路由器c<sub>n</sub>,集合C代表移动节点日常经过的所有接入路由器,T代表每天划分的X个时间段集合,X=12或24或48或72。
地址 315211 浙江省宁波市江北区风华路818号
您可能感兴趣的专利