发明名称 |
一种多语种混合检索方法和系统 |
摘要 |
本发明提供了一种多语种混合检索方法和系统,涉及网络技术领域。本发明的方法包括:接收用户端输入的查询词,并识别所述查询词的所属源语种;将所述查询词从源语种翻译为各目标语种的查询词;所述各目标语种为与所述源语种不同的语种;对于每个语种的查询词,基于所述查询词检索对应各语种网页信息的索引,获得相应语种的网页信息;对于由各目标语种对应的索引获得的网页信息,获取从各目标语种翻译为源语种后的网页信息;对于得到的所有网页信息,返回至少一条网页信息至用户端。本发明去除了现有技术对于在检索过程中全文翻译的依赖,降低因翻译而存在的信息损失问题,降低没有明显上下文关系的信息的翻译信息损失问题,提高搜索结果的精确度。 |
申请公布号 |
CN103488648A |
申请公布日期 |
2014.01.01 |
申请号 |
CN201210194972.X |
申请日期 |
2012.06.13 |
申请人 |
阿里巴巴集团控股有限公司 |
发明人 |
郑伟;林锋;金华兴;孙丽;刘清富 |
分类号 |
G06F17/30(2006.01)I;G06F17/28(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京润泽恒知识产权代理有限公司 11319 |
代理人 |
苏培华 |
主权项 |
一种多语种混合检索方法,其特征在于,包括:接收用户端输入的查询词,并识别所述查询词的所属源语种;将所述查询词从源语种翻译为各目标语种的查询词;所述各目标语种为与所述源语种不同的语种;对于每个语种的查询词,基于所述查询词检索对应各语种网页信息的索引,获得相应语种的网页信息;对于由各目标语种对应的索引获得的网页信息,获取从各目标语种翻译为源语种后的网页信息;对于得到的所有网页信息,返回至少一条网页信息至用户端。 |
地址 |
英属开曼群岛大开曼资本大厦一座四层847号邮箱 |