发明名称 一种多语种混合检索方法和系统
摘要 本发明提供了一种多语种混合检索方法和系统,涉及网络技术领域。本发明的方法包括:接收用户端输入的查询词,并识别所述查询词的所属源语种;将所述查询词从源语种翻译为各目标语种的查询词;所述各目标语种为与所述源语种不同的语种;对于每个语种的查询词,基于所述查询词检索对应各语种网页信息的索引,获得相应语种的网页信息;对于由各目标语种对应的索引获得的网页信息,获取从各目标语种翻译为源语种后的网页信息;对于得到的所有网页信息,返回至少一条网页信息至用户端。本发明去除了现有技术对于在检索过程中全文翻译的依赖,降低因翻译而存在的信息损失问题,降低没有明显上下文关系的信息的翻译信息损失问题,提高搜索结果的精确度。
申请公布号 CN103488648A 申请公布日期 2014.01.01
申请号 CN201210194972.X 申请日期 2012.06.13
申请人 阿里巴巴集团控股有限公司 发明人 郑伟;林锋;金华兴;孙丽;刘清富
分类号 G06F17/30(2006.01)I;G06F17/28(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京润泽恒知识产权代理有限公司 11319 代理人 苏培华
主权项 一种多语种混合检索方法,其特征在于,包括:接收用户端输入的查询词,并识别所述查询词的所属源语种;将所述查询词从源语种翻译为各目标语种的查询词;所述各目标语种为与所述源语种不同的语种;对于每个语种的查询词,基于所述查询词检索对应各语种网页信息的索引,获得相应语种的网页信息;对于由各目标语种对应的索引获得的网页信息,获取从各目标语种翻译为源语种后的网页信息;对于得到的所有网页信息,返回至少一条网页信息至用户端。
地址 英属开曼群岛大开曼资本大厦一座四层847号邮箱