主权项 |
一种基于百度地图API的地理位置实体规范化方法,其特征在于,包括以下步骤:步骤1):利用百度地图API,对缺陷地理位置实体进行检索,其中,所述缺陷地理位置实体是指地名区域缺失或者地名区域模糊的地理位置实体,记为defectLoc;步骤2):利用步骤1)的检索结果,构建缺陷地理位置实体的区域特征向量;步骤3):利用所述区域特征向量,对明确地理位置实体进行规范化;其中,所述明确地理位置实体,是指检索结果中出现且只出现一个区域或者检索结果中每个区域概率的最大值Max(P(area<sub>i</sub>|defectLoc))≥γ的defectLoc,记为clearLoc,其中γ为clearLoc的参数;其中概率P(area<sub>i</sub>|defectLoc)的计算公式如式(1)所示:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>P</mi><mrow><mo>(</mo><msub><mi>area</mi><mi>i</mi></msub><mo>{</mo><mi>d</mi><mi>e</mi><mi>f</mi><mi>e</mi><mi>c</mi><mi>t</mi><mi>L</mi><mi>o</mi><mi>c</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>S</mi><mi>c</mi><mi>o</mi><mi>r</mi><mi>e</mi><mrow><mo>(</mo><msub><mi>area</mi><mi>i</mi></msub><mo>|</mo><mi>d</mi><mi>e</mi><mi>f</mi><mi>e</mi><mi>c</mi><mi>t</mi><mi>L</mi><mi>o</mi><mi>c</mi><mo>)</mo></mrow></mrow><mrow><munderover><mo>Σ</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mi>S</mi><mi>c</mi><mi>o</mi><mi>r</mi><mi>e</mi><mrow><mo>(</mo><msub><mi>area</mi><mi>j</mi></msub><mo>|</mo><mi>d</mi><mi>e</mi><mi>f</mi><mi>e</mi><mi>c</mi><mi>t</mi><mi>L</mi><mi>o</mi><mi>c</mi><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FSA0000121541310000011.GIF" wi="1166" he="213" /></maths>步骤4):利用所述明确地理位置实体,对歧义地理位置实体进行规范化;其中,所述歧义地理位置实体,是指检索结果中出现了多个区域且Max(P(area<sub>i</sub>|Location))<γ的defectLoc,记为ambiguityLoc;步骤5):利用等价地理位置实体,对零地理位置实体进行规范化;其中,所述等价地理实体,是指检索过程中,搜索输入框中输入的地理位置实体与检索结果中的地理位置实体等价,记为equalLoc;所述零地位置实体,是指检索结果中未出现区域信息的defectLoc,记为zeroLoc。 |