发明名称 同义词的确定、搜索方法及服务器
摘要 本发明涉及一种同义词的确定、搜索方法及服务器,包括:搜集与预先给定的给定词有关联关系的文本集合,所述文本集合中包括多个文本;当识别到所述文本中直接包含所述给定词时,则根据所述文本,确定文本模式,并从所述文本模式中提取参考文本模式;当识别到所述文本中不直接包含所述给定词时,将所述文本加入同义词文本库中;根据所述参考文本模式,从所述同义词文本库中提取所述给定词的同义词,将提取的同义词作为所述给定词的同义词。由于用于提取文本模式的文本与给定词之间的关系是明确的,根据该文本找到的同义词就会与给定词具有非常直接的关系,因此,可以提高同义词确定的全面性和准确性,从而可以提高搜索结果的准确性和效率。
申请公布号 CN105095203A 申请公布日期 2015.11.25
申请号 CN201410156107.5 申请日期 2014.04.17
申请人 阿里巴巴集团控股有限公司 发明人 李红松;陈春明;陈俊波;王力;庞昂博;章鹏
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京亿腾知识产权代理事务所 11309 代理人 李楠
主权项 一种同义词的确定方法,其特征在于,所述方法包括:搜集与预先给定的给定词有关联关系的文本集合,所述文本集合中包括多个文本;当识别到所述文本中直接包含所述给定词时,则根据所述文本,确定文本模式,并从所述文本模式中提取参考文本模式;当识别到所述文本中不直接包含所述给定词时,将所述文本加入同义词文本库中;根据所述参考文本模式,从所述同义词文本库中提取所述给定词的同义词,将提取的同义词作为所述给定词的同义词。
地址 英属开曼群岛大开曼资本大厦一座四层847号邮箱