发明名称 获取内容彼此相对应的多种语言文本的装置和方法
摘要 公开了一种用于获取内容彼此相对应的多种语言文本的装置,包括:关键图像生成单元,其被配置为生成与待获取的多种语言文本的内容相关的关键图像;和文本获取单元,其被配置为确定预定的信息源中与该关键图像相匹配的关键图像匹配信息,并根据预定规则从该关键图像匹配信息提取得到内容彼此相对应的多种语言文本。还公开一种用于获取内容彼此相对应的多种语言文本的方法。根据本发明实施例的解决方案可以改善所获取的多种语言对齐文本的精确度,此外还能够提高获取多种语言对齐文本的效率。
申请公布号 CN102375824B 申请公布日期 2014.10.22
申请号 CN201010253505.0 申请日期 2010.08.12
申请人 富士通株式会社 发明人 孟遥;刘汝杰;于浩
分类号 G06F17/30(2006.01)I;G06F17/28(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 王萍;李春晖
主权项 一种用于获取内容彼此相对应的多种语言文本的装置,包括:关键图像生成单元,其被配置为根据待获取的多种语言文本的内容生成与待获取的多种语言文本的内容相关的关键图像,所述关键图像生成单元包括:关键字匹配信息确定子单元,其被配置为确定预定的信息源中与关键字匹配的关键字匹配信息,其中所述关键字与待获取的多种语言文本的内容相关;以及关键图像选择子单元,其被配置为从所述关键字匹配信息中选择所述关键图像;和文本获取单元,其被配置为确定所述预定的信息源中与所述关键图像相匹配的关键图像匹配信息,并根据预定规则从所述关键图像匹配信息提取得到内容彼此相对应的多种语言文本,其中所述语言文本位于所述关键图像匹配信息中;关键信息扩展单元,其被配置为:从由所述文本获取单元所确定的所述关键图像匹配信息中选择与待获取的多种语言文本的内容相关的扩展的关键字;其中所述关键字匹配信息确定子单元被配置为进一步利用由所述关键信息扩展单元所选择的所述扩展的关键字,确定所述预定的信息源中与所述扩展的关键字相匹配的、扩展的关键字匹配信息;所述关键图像选择子单元被配置为进一步从所述扩展的关键字匹配信息中选择与待获取的多种语言文本的内容相关的扩展的关键图像;以及所述文本获取单元被配置为进一步利用所述扩展的关键图像确定所述预定的信息源中与所述扩展的关键图像相匹配的、扩展的关键图像匹配信息,并根据预定规则从所述扩展的关键图像匹配信息提取内容与已经获取的多种语言文本的内容相对应的、扩展的多种语言文本。
地址 日本神奈川县