发明名称 中文姓名的计算机识别及检索方法
摘要 一种中文姓名的计算机识别及检索方法,包括用于计算机检索的数据源,该方法的步骤包括从所述的数据源中随机选取学数据源,根据姓名识别规则库的内容对分析的数据源进行姓名识别,再创建索引,提供检索结果。姓名识别规则库包括姓氏配置文件、电子版高频词词典和姓氏前、后的高频单字文件。本发明能够有效地从被检索对象中快捷地识别中文姓名,获得较高的识别准确性,而且能够通过相关度的调整、排序,获得更准确的高质量检索结果。
申请公布号 CN1342942A 申请公布日期 2002.04.03
申请号 CN00124352.7 申请日期 2000.09.08
申请人 百度在线网络技术(北京)有限公司 发明人 崔珊珊;雷鸣;刘建国;李彦宏
分类号 G06F17/30 主分类号 G06F17/30
代理机构 北京三友知识产权代理有限公司 代理人 刘芳
主权项 1、一种中文姓名的计算机识别及检索方法,包括用于计算机检索的数据源,其特征在于:该方法的步骤包括从所述的数据源中随机选取学习数据源,根据姓名识别规则库的内容对分析的数据源进行姓名识别,再创建索引,提供检索结果。
地址 100080北京市海淀区北大资源宾馆1420房间