发明名称 一种微博客蕴含交通信息融合的D-S证据理论方法
摘要 本发明公开了一种微博客蕴含交通信息融合的D‑S证据理论方法,所述方法包括:根据交通拥挤程度,确定证据理论辨识框架及命题空间;根据时间窗口及道路路段,抓取与交通信息主题相关的微博客内容,组成需要融合的微博客数据集;微博客数据集预处理;计算微博客数据集交通状态描述词汇的词义相似度,引入中文语料库资源,提高词义相似度计算精度;计算微博客词义相似度加权评价,构建证据理论基本概率分配函数;根据Dempster组合规则对多条微博客证据源,进行证据合成,确定辨识空间内各命题的信任区间,选取信任区间中信任函数最大的命题作为融合结果。利用本发明可以实现微博客蕴含交通信息的融合,为城市交通信息的采集提供一种重要数据源。
申请公布号 CN102855272B 申请公布日期 2016.08.17
申请号 CN201210243199.1 申请日期 2012.07.16
申请人 中国科学院地理科学与资源研究所 发明人 陆锋;张恒才
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种微博客蕴含交通信息融合的D‑S证据理论方法,其特征在于,步骤包括:根据交通拥挤程度,确定证据理论辨识框架Θ及命题空间2<sup>Θ</sup>;根据有效时间窗口T<sub>interval</sub>和路网路段road,抓取与交通信息主题相关的微博客内容,组成需要融合的微博客数据集V;微博客消息V<sub>i</sub>预处理操作,包括自然语言分词、词义消歧、词义干化,得到微博客交通状态词汇集W<sub>i</sub>;引入中文语料库资源Corpus={C<sub>wikipedia</sub>,C<sub>hownet</sub>,...},计算微博客交通状态词汇集W<sub>i</sub>与命题空间中词汇的词义相似度Sim;计算微博客消息V<sub>i</sub>的词义相似度加权评价Score<sub>i</sub>,确定证据理论基本概率分配函数m(V<sub>i</sub>);通过Dempster合成法则进行证据合成及证据决策,确定该路段road微博客蕴含交通信息融合结果TState<sub>road</sub>。
地址 100101 北京市朝阳区大屯路甲11号