发明名称 |
一种微博客蕴含交通信息融合的D-S证据理论方法 |
摘要 |
本发明公开了一种微博客蕴含交通信息融合的D‑S证据理论方法,所述方法包括:根据交通拥挤程度,确定证据理论辨识框架及命题空间;根据时间窗口及道路路段,抓取与交通信息主题相关的微博客内容,组成需要融合的微博客数据集;微博客数据集预处理;计算微博客数据集交通状态描述词汇的词义相似度,引入中文语料库资源,提高词义相似度计算精度;计算微博客词义相似度加权评价,构建证据理论基本概率分配函数;根据Dempster组合规则对多条微博客证据源,进行证据合成,确定辨识空间内各命题的信任区间,选取信任区间中信任函数最大的命题作为融合结果。利用本发明可以实现微博客蕴含交通信息的融合,为城市交通信息的采集提供一种重要数据源。 |
申请公布号 |
CN102855272B |
申请公布日期 |
2016.08.17 |
申请号 |
CN201210243199.1 |
申请日期 |
2012.07.16 |
申请人 |
中国科学院地理科学与资源研究所 |
发明人 |
陆锋;张恒才 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种微博客蕴含交通信息融合的D‑S证据理论方法,其特征在于,步骤包括:根据交通拥挤程度,确定证据理论辨识框架Θ及命题空间2<sup>Θ</sup>;根据有效时间窗口T<sub>interval</sub>和路网路段road,抓取与交通信息主题相关的微博客内容,组成需要融合的微博客数据集V;微博客消息V<sub>i</sub>预处理操作,包括自然语言分词、词义消歧、词义干化,得到微博客交通状态词汇集W<sub>i</sub>;引入中文语料库资源Corpus={C<sub>wikipedia</sub>,C<sub>hownet</sub>,...},计算微博客交通状态词汇集W<sub>i</sub>与命题空间中词汇的词义相似度Sim;计算微博客消息V<sub>i</sub>的词义相似度加权评价Score<sub>i</sub>,确定证据理论基本概率分配函数m(V<sub>i</sub>);通过Dempster合成法则进行证据合成及证据决策,确定该路段road微博客蕴含交通信息融合结果TState<sub>road</sub>。 |
地址 |
100101 北京市朝阳区大屯路甲11号 |