发明名称 | 同义词的确定、搜索方法及服务器 | ||
摘要 | 本发明涉及一种同义词的确定、搜索方法及服务器,包括:搜集与预先给定的给定词有关联关系的文本集合,所述文本集合中包括多个文本;当识别到所述文本中直接包含所述给定词时,则根据所述文本,确定文本模式,并从所述文本模式中提取参考文本模式;当识别到所述文本中不直接包含所述给定词时,将所述文本加入同义词文本库中;根据所述参考文本模式,从所述同义词文本库中提取所述给定词的同义词,将提取的同义词作为所述给定词的同义词。由于用于提取文本模式的文本与给定词之间的关系是明确的,根据该文本找到的同义词就会与给定词具有非常直接的关系,因此,可以提高同义词确定的全面性和准确性,从而可以提高搜索结果的准确性和效率。 | ||
申请公布号 | CN105095203A | 申请公布日期 | 2015.11.25 |
申请号 | CN201410156107.5 | 申请日期 | 2014.04.17 |
申请人 | 阿里巴巴集团控股有限公司 | 发明人 | 李红松;陈春明;陈俊波;王力;庞昂博;章鹏 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京亿腾知识产权代理事务所 11309 | 代理人 | 李楠 |
主权项 | 一种同义词的确定方法,其特征在于,所述方法包括:搜集与预先给定的给定词有关联关系的文本集合,所述文本集合中包括多个文本;当识别到所述文本中直接包含所述给定词时,则根据所述文本,确定文本模式,并从所述文本模式中提取参考文本模式;当识别到所述文本中不直接包含所述给定词时,将所述文本加入同义词文本库中;根据所述参考文本模式,从所述同义词文本库中提取所述给定词的同义词,将提取的同义词作为所述给定词的同义词。 | ||
地址 | 英属开曼群岛大开曼资本大厦一座四层847号邮箱 |