发明名称 |
一种通讯地址识别、标准化的方法 |
摘要 |
本发明提供一种通讯地址识别、标准化的方法,用于解决通讯地址识别和标准化的问题。所述一种通讯地址识别和标准化的方法为:输入通讯地址;利用地址元数据字典,对所述输入的通讯地址进行切分,并生成切分的地址元数据组;对所述切分的地址元数据组进行标注,并生成标注的地址元数据组;对所述标注的地址元数据组,计算其相应的权值并输出权值最大的地址元数据组;利用地址元数据字典,对所述权值最大的地址元数据组进行标准化,生成标准化的通讯地址;输出所述标准化的通讯地址。本发明提高了通讯地址处理的精确度,通讯地址处理的吞吐率、召回率较高。 |
申请公布号 |
CN102955833B |
申请公布日期 |
2015.11.25 |
申请号 |
CN201110255618.9 |
申请日期 |
2011.08.31 |
申请人 |
深圳市华傲数据技术有限公司 |
发明人 |
王国印;贾西贝 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳市华优知识产权代理事务所(普通合伙) 44319 |
代理人 |
余薇 |
主权项 |
一种通讯地址识别和标准化的方法,其特征在于:所述一种通讯地址识别和标准化的方法包括以下步骤:步骤S100:输入通讯地址;步骤S200:利用地址元数据字典,对所述输入的通讯地址进行切分,并生成切分的地址元数据组,所述地址元数据字典包括分级地址元数据字典和地址别名元数据字典,所述的地址别名元数据字典用于存储地址别名元数据,所述的地址别名元数据字典与所述的分级地址元数据字典中的元数据具有映射关系;步骤S300:利用所述分级地址元数据字典对所述切分的地址元数据组进行标注,并生成标注的地址元数据组;步骤S400:对所述标注的地址元数据组,计算其相应的权值并输出权值最大的地址元数据组;步骤S500:利用地址元数据字典,对所述权值最大的地址元数据组进行标准化,生成标准化的通讯地址,所述标准化利用所述地址元数据字典的地址别名元数据字典,对输入的地址别名进行标准化,地址标准化的名称为地址的官方全名;步骤S600:输出所述标准化的通讯地址。 |
地址 |
518057 广东省深圳市高新区中区高新中一道9号软件大厦7楼713室 |