发明名称 |
一种对通信号码的处理方法及装置 |
摘要 |
本发明实施例公开了一种对通信号码的处理方法及装置,其中,所述方法包括:调用网络爬虫模块在目标网站的站点内进行字符搜索和网页下载;根据预置的记录数字的字典树,对在所述目标网站的站点内搜索并下载到的网页的网页文本进行通信号码搜索和验证,所述字典树是根据通信号码的号码特征进行设置的,所述号码特征至少包括通信号码的位数;若验证结果为搜索到通信号码,则在所述目标网站的站点内获取该字符串的附属特征,根据搜索到的附属特征和所述字符串,生成关于所述字符串的号码信息。采用本发明,能够快速、准确地确定出包括通信号码及其附属特征的号码信息,方便后续快速地完成黄页数据库的更新。 |
申请公布号 |
CN106021439A |
申请公布日期 |
2016.10.12 |
申请号 |
CN201610323535.1 |
申请日期 |
2016.05.16 |
申请人 |
腾讯科技(深圳)有限公司 |
发明人 |
王逐尘 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
广州三环专利代理有限公司 44202 |
代理人 |
郝传鑫;熊永强 |
主权项 |
一种对通信号码的处理方法,其特征在于,包括:调用网络爬虫模块在目标网站的站点内进行字符搜索和网页下载;根据预置的记录数字的字典树,对在所述目标网站的站点内搜索并下载到的网页的网页文本进行通信号码搜索和验证,所述字典树是根据通信号码的号码特征进行设置的,所述号码特征至少包括通信号码的位数;若验证结果为在所述网页文本内搜索到作为通信号码的字符串,则在所述目标网站的站点内获取该字符串的附属特征,根据搜索到的附属特征和所述字符串,生成关于所述字符串的号码信息。 |
地址 |
518000 广东省深圳市福田区振兴路赛格科技园2栋东403室 |