发明名称 用于查询扩展的音译
摘要 本发明涉及用于识别用于查询扩展的音译词语的候选同义词的方法、系统和装置,包括计算机程序产品。在一方面中,方法包括识别目标语言的多个音译词语。对于目标语言的多个音译词语中的每个音译词语,所述音译词语被映射到源语言的一个或多个词语。对于目标语言的多个音译词语中的第一音译词语,目标语言的多个音译词语中的一个或多个第二音译词语被识别为第一音译词语的候选同义词,其中所述一个或多个第二音译词语中的每一个被映射到也从所述第一音译词语映射的源语言的至少一个词语。
申请公布号 CN101630333B 申请公布日期 2014.07.16
申请号 CN200910164542.1 申请日期 2009.07.20
申请人 谷歌公司 发明人 皮尤什·普拉拉德卡;拉利特什·卡特拉嘎达;维内特·古普塔
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 中原信达知识产权代理有限责任公司 11219 代理人 张焕生;安翔
主权项 一种识别用于查询扩展的音译词语的候选同义词的方法,包括:使用一个或多个计算机识别目标语言的多个音译词语,其中识别所述目标语言的所述多个音译词语包括:从web资源识别包含仅仅所述目标语言的字符的词语,计算用于包含仅仅所述目标语言的字符的词语中的每个识别的词语的统计量,其中用于每个识别的词语的所述统计量是基于:与讲源语言的一个或多个地区相关联的web资源中所述识别的词语的出现概率相对于与任何地区相关联的web资源中所述识别的词语的出现概率的比率;将用于每个识别的词语的所述统计量与指定的阈值进行比较;以及如果用于特定的识别的词语的统计量超过所指定的阈值,则将所述特定的识别的词语包括在所述目标语言的所述多个音译词语中;对于所述目标语言的所述多个音译词语中的每个音译词语,将所述音译词语映射到所述源语言的一个或多个词语;以及对于所述目标语言的所述多个音译词语中的第一音译词语,识别所述目标语言的所述多个音译词语中的一个或多个第二音译词语作为所述第一音译词语的候选同义词,其中所述一个或多个第二音译词语中的每一个被映射到也从所述第一音译词语映射的所述源语言的至少一个词语。
地址 美国加利福尼亚州