发明名称 文档图像生成装置和文档图像生成方法
摘要 本发明提供一种文档图像生成装置、文档图像生成方法以及计算机程序。其能够维持文档布局的同时追加文档中的单词和词组的译词等补充说明,使得文档更容易理解。本发明的文档图像生成装置从使用图像读取装置(31)等取得的原文档图像识别字符,进行由所识别的字符构成的文档的自然语言处理,由此获得文档包含的单词或词组的译词(补充说明)。通过将在与靠近单词或词组的行间的位置相当的位置配置了译词的补充说明文本层与由原文档图像构成的原文档图像层重叠,生成带补充说明的文档图像。对于不连续词组,除了译词还配置下划线。能够维持文档的布局,容易对原文档和带译词的文档进行比较。
申请公布号 CN102053950B 申请公布日期 2013.10.16
申请号 CN201010538990.6 申请日期 2010.11.05
申请人 夏普株式会社 发明人 佐田以知子;九津见毅
分类号 G06F17/21(2006.01)I;G06F17/27(2006.01)I;G06F17/28(2006.01)I;G06K9/20(2006.01)I 主分类号 G06F17/21(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 杜诚;陈炜
主权项 一种文档图像生成装置,由表现包含多个行的文档的图像,生成表现对文档附加了对文档包含的单词或由多个单词构成的词组的补充说明的带补充说明的文档的图像,所述文档图像生成装置包括:原文档图像取得部,取得表现文档的原文档图像;字符识别部,进行该原文档图像取得部所取得的原文档图像包含的字符的识别和原文档图像中的字符位置的特别指定;补充说明取得部,通过对由该字符识别部所识别的字符构成的文档进行自然语言处理,确定文档包含的单词或词组的含义,取得与各单词或词组的含义对应的补充说明;位置决定部,根据所述字符识别部所识别的字符的位置,对于与各单词或词组对应地取得的补充说明,将在原文档图像中与该单词或词组靠近的行间的位置确定为要在文档中配置补充说明的位置;和图像生成部,通过将补充说明文本层与由原文档图像构成的原文档图像层重叠,生成表现带补充说明的文档的图像,所述补充说明文本层在与该位置决定部所确定的原文档图像中的位置相当的位置配置了各补充说明,其中所述位置决定部包括:词组判定部,判定取得了补充说明的词组是否是该词组包含的多个单词在文档中不连续配置的不连续词组;和说明配置位置决定部,在取得了补充说明的词组是不连续词组的情况下,将与不连续词组包含的起始单词、不连续词组包含的连续单词列、或不连续词组包含的最长单词中的任意一个在原文档图像中靠近的行间的位置确定为要在文档中配置补充说明的位置。
地址 日本大阪府大阪市