发明名称 选择用于文本分割的语言的方法和系统
摘要 公开了用于选择文本分割的语言的方法和系统。在一个实施例中,识别出与字符串相关联的至少第一备选语言和第二备选语言;至少确定与第一备选语言相关联的第一分割结果和与第二备选语言相关联的第二分割结果;确定第一分割结果出现的第一频率和第二分割结果出现的第二频率;以及至少部分地基于所述出现的第一频率和所述出现的第二频率,从第一备选语言和第二备选语言识别可行的语言。
申请公布号 CN102708095A 申请公布日期 2012.10.03
申请号 CN201210063033.1 申请日期 2005.09.28
申请人 谷歌公司 发明人 杰拉德·以色列·埃尔巴兹;雅各布·L·曼德尔森
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 王玮
主权项 一种计算机实现的方法,包括:接收没有分割段描述分隔符的字符串;识别针对所述字符串的至少第一备选语言和第二备选语言;至少确定包括第一多个分割段的第一分割结果和包括第二多个分割段的第二分割结果,所述第一多个分割段与包括所述字符串的所述第一备选语言相关联,以及所述第二多个分割段与包括所述字符串的所述第二备选语言相关联;通过使用搜索引擎确定响应于包括所述第一分割结果的搜索疑问而产生的搜索结果集合中的项目标识符的数量,确定所述第一分割结果出现的第一频率;以及通过使用搜索引擎确定响应于包括所述第二分割结果的搜索疑问而产生的搜索结果集合中的项目标识符的数量,确定所述第二分割结果出现的第二频率;以及至少部分地基于所述出现的第一频率和所述出现的第二频率,从所述第一备选语言和第二备选语言来识别并输出可行的语言。
地址 美国加利福尼亚州