发明名称 跨语言获取搜索资源的方法和装置及对应搜索方法和装置
摘要 本发明提供了一种跨语言获取搜索资源的方法和装置及对应搜索方法和装置,其中获取搜索资源的方法包括:确定目标领域D;利用目标领域D的已有第一语言资源Set(C),结合特征抽取技术以及从第一语言到第二语言的机器翻译技术,确定目标领域D的第二语言特征向量FeaVec_F;对第二语言的通用语料资源库Cor(F)中的各资源进行特征抽取,得到各资源的特征向量FeaVec_d<sub>i</sub>;从Cor(F)中筛选出特征向量FeaVec_d<sub>i</sub>与FeaVec_F之间相似度超过预设阈值T的资源SetD(F);将SetD(F)添加入目标领域D的搜索资源库RDB(C)。通过本发明能够为用户提供更多、更优质的搜索资源,提高搜索效果。
申请公布号 CN102779135B 申请公布日期 2015.07.01
申请号 CN201110124378.9 申请日期 2011.05.13
申请人 北京百度网讯科技有限公司 发明人 赵世奇;柴春光;吴华
分类号 G06F17/30(2006.01)I;G06F17/28(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京鸿德海业知识产权代理事务所(普通合伙) 11412 代理人 袁媛
主权项 一种跨语言获取搜索资源的方法,其特征在于,该方法包括:A、确定目标领域D;B、利用目标领域D的已有第一语言资源Set(C),结合特征抽取技术以及从第一语言到第二语言的机器翻译技术,确定目标领域D的第二语言特征向量FeaVec_F;C、对第二语言的通用语料资源库Cor(F)中的各资源进行特征抽取,得到各资源的特征向量FeaVec_d<sub>i</sub>;D、从所述Cor(F)中筛选出特征向量FeaVec_d<sub>i</sub>与所述FeaVec_F之间相似度超过预设阈值T的资源SetD(F);E、将所述SetD(F)添加入所述目标领域D的搜索资源库RDB(C)。
地址 100085 北京市海淀区上地十街10号百度大厦2层