发明名称 机构名称检索方法及系统
摘要 一种机构名称检索方法和系统,将所有机构名称自动切分为地名R、标识I、类型T和后缀S四部分,将所有机构名称转换为缩写字母,建立对所有标识I所对应字母缩写的全文索引以及语言模型,建立地名词典、类型同义词词典和后缀同义词词典,接受输入字母串并切分出标识I全文检索,检索地名R、类型T和后缀S,得出候选检索结果进行排序并输出。本发明可以准确、快速地以字母检索中西文机构名称,实现对用户输入最大限度地容错,在不损失准确率的前提下缩短信息搜索时间,同时具有自动学功能。
申请公布号 CN101930435B 申请公布日期 2013.03.20
申请号 CN200910110372.9 申请日期 2009.10.27
申请人 深圳市北科瑞声科技有限公司;深港产学研基地产业发展中心 发明人 夏云庆;刘轶;程刚;刘伟
分类号 G06F17/30(2006.01)I;H04M3/51(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 广州华进联合专利商标代理有限公司 44224 代理人 何平
主权项 一种机构名称检索方法,包括如下步骤:S11:将业务数据中所有机构名称自动切分为地名R、标识I、类型T和后缀S四部分,地名R是指出现在机构名称中的地理名称,标识I是指标识机构名称的核心词汇,类型T指区分机构类型的词汇,后缀S指出现在机构名称汇总的后缀词汇;S12:将业务数据中所有机构名称转换为缩写字母;S13:建立对所有标识I各自字母缩写的全文索引;S14:建立标识I字母语言模型;S15:建立地名词典、类型同义词词典和后缀同义词词典;S16:建立用户检索界面,接收输入字母串并切分出地名R、标识I、类型T和后缀S四部分,得出标识I,全文检索,得出候选检索结果和候选检索结果所对应的检索分数;其中,得出标识I,采用了如下规则:所有机构名称全称都包含地名R、标识I、类型T和后缀S;即使在机构名称的最强省略情况下都不会丢失标识I,且出现在输入字母串靠前的位置;机构名称中的不同部分的输入可以颠倒顺序,但各部分内部汉字的顺序不可颠倒;在任何状态下的输入字母串应包含机构名称标识I;S17:检索地名R、类型T和后缀S,缩小候选检索结果范围;S18:对候选检索结果进行排序并输出。
地址 518057 广东省深圳市南山区高新南环路29号留学生创业大厦1004室