发明名称 一种基于百度地图API的地理位置实体规范化方法
摘要 本发明涉及一种基于百度地图API的地理位置实体规范化方法,包括以下步骤:步骤1):利用百度地图API,对缺陷地理位置实体进行检索;步骤2):利用步骤1)的检索结果,构建缺陷地理位置实体的区域特征向量;步骤3):利用所述区域特征向量,对明确地理位置实体进行规范化;步骤4):利用所述明确地理位置实体,对歧义地理位置实体进行规范化;步骤5):利用等价地理位置实体,对零地理位置实体进行规范化。本发明以城市管理投诉文本为基础,利用地图API实现地理位置实体的规范化,结合城市管理投诉文本的特点、地理位置实体中存在的问题,对不完整的地理位置实体进行区域补全,从而解决了统计分析工作难以进行的局面。
申请公布号 CN105335468A 申请公布日期 2016.02.17
申请号 CN201510623640.2 申请日期 2015.09.28
申请人 北京信息科技大学;北京市新技术应用研究所 发明人 吕学强;刘克会;董志安;李雪伟
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种基于百度地图API的地理位置实体规范化方法,其特征在于,包括以下步骤:步骤1):利用百度地图API,对缺陷地理位置实体进行检索,其中,所述缺陷地理位置实体是指地名区域缺失或者地名区域模糊的地理位置实体,记为defectLoc;步骤2):利用步骤1)的检索结果,构建缺陷地理位置实体的区域特征向量;步骤3):利用所述区域特征向量,对明确地理位置实体进行规范化;其中,所述明确地理位置实体,是指检索结果中出现且只出现一个区域或者检索结果中每个区域概率的最大值Max(P(area<sub>i</sub>|defectLoc))≥γ的defectLoc,记为clearLoc,其中γ为clearLoc的参数;其中概率P(area<sub>i</sub>|defectLoc)的计算公式如式(1)所示:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>P</mi><mrow><mo>(</mo><msub><mi>area</mi><mi>i</mi></msub><mo>{</mo><mi>d</mi><mi>e</mi><mi>f</mi><mi>e</mi><mi>c</mi><mi>t</mi><mi>L</mi><mi>o</mi><mi>c</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>S</mi><mi>c</mi><mi>o</mi><mi>r</mi><mi>e</mi><mrow><mo>(</mo><msub><mi>area</mi><mi>i</mi></msub><mo>|</mo><mi>d</mi><mi>e</mi><mi>f</mi><mi>e</mi><mi>c</mi><mi>t</mi><mi>L</mi><mi>o</mi><mi>c</mi><mo>)</mo></mrow></mrow><mrow><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mi>S</mi><mi>c</mi><mi>o</mi><mi>r</mi><mi>e</mi><mrow><mo>(</mo><msub><mi>area</mi><mi>j</mi></msub><mo>|</mo><mi>d</mi><mi>e</mi><mi>f</mi><mi>e</mi><mi>c</mi><mi>t</mi><mi>L</mi><mi>o</mi><mi>c</mi><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FSA0000121541310000011.GIF" wi="1166" he="213" /></maths>步骤4):利用所述明确地理位置实体,对歧义地理位置实体进行规范化;其中,所述歧义地理位置实体,是指检索结果中出现了多个区域且Max(P(area<sub>i</sub>|Location))<γ的defectLoc,记为ambiguityLoc;步骤5):利用等价地理位置实体,对零地理位置实体进行规范化;其中,所述等价地理实体,是指检索过程中,搜索输入框中输入的地理位置实体与检索结果中的地理位置实体等价,记为equalLoc;所述零地位置实体,是指检索结果中未出现区域信息的defectLoc,记为zeroLoc。
地址 100192 北京市海淀区清河小营东路12号
您可能感兴趣的专利