发明名称 文本图像检索设备
摘要 本发明提供一种文本图像检索设备,其不使用OCR那样需要附加情报的设备,即使检索对象之文本图像很多,仅使用符号列中合适的符号部分列,就能够高速检索文本图像。符号列检索装置1将被输入的符号列从先头开始依次一个一个地移动,来剪切取出规定长度的部分列。每剪切取出一个部分列,就检查从符号列索引装置4所取得的文本出现频率是否满足规定的条件,并包满足条件的部分列作为检索用的部分列来收集。使用收集到的部分列,能够与在已有的文本检索中通过多个检索词合成检索的方法相同的步骤来检索。
申请公布号 CN101329689B 申请公布日期 2011.06.08
申请号 CN200810125319.1 申请日期 2008.06.18
申请人 株式会社理光 发明人 池田哲也;平冈卓也
分类号 G06F17/30(2006.01)I;G06K9/20(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 王冉
主权项 一种文本图像检索设备,其包括:文本图像变换装置,其从被输入的文本图像抽出文字的图像后生成符号列,其中,符号是从所抽出的文字的图像的外接矩形中抽出表示矩形的配置状态的特征,并将所抽出的表示矩形配置状态的特征量化后所生成的符号的集合,而符号列是指符号的一个列子单位的矩形;符号列索引装置,其存储通过所述文本图像变换装置所生成的符号列以及文本图像之间的对应关系;符号列登录装置,其从所述文本图像变换装置所生成的符号列,剪切取出规定长度的符号部分列后,登录到所述符号列索引装置里;符号列检索装置,其从符号列的先头开始,依次阶段地将规定长度的符号部分列,作为检索符号部分列来剪切取出;由所述符号列检索装置剪切取出的所述检索符号部分列是,使得登录在所述符号列索引装置里的与检索符号部分列对应的文本图像的数量满足规定的条件,所述规定的条件作为夹在事先确定的上下限之间的值而被定义。
地址 日本东京都
您可能感兴趣的专利