发明名称 一种基于网页拓扑结构的网页地理位置识别方法
摘要 本发明公开了一种基于网页拓扑结构的网页地理位置识别方法,该方法包括:A、提取网页拓扑结构的步骤;B、提取网页内容的步骤;以及C、计算地区相关性并排序的步骤。利用本发明方法,在网页缺乏地址词时,能够通过对网页拓扑结构和对特殊意义的普通词进行处理识别出网页地理位置。
申请公布号 CN103064930A 申请公布日期 2013.04.24
申请号 CN201210564540.3 申请日期 2012.12.21
申请人 人民搜索网络股份公司 发明人 王敏;宫天翔;史佳佳;杨之光;杨青
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京汇泽知识产权代理有限公司 11228 代理人 刘淑敏
主权项 一种基于网页拓扑结构的网页地理位置识别方法,其特征在于,该方法包括:A、提取网页拓扑结构的步骤;B、提取网页内容的步骤;C、计算地区相关性并排序的步骤。
地址 100020 北京市朝阳区东三环中路1号环球金融中心西塔16层