发明名称 |
OCR装置、文件检索系统 |
摘要 |
本发明提供一种作为对纸文件及文件图像进行文件检索的OCR装置、文件检索系统及文件检索手段,该手段是应用文字识别技术,检索含有给定关键词的文件群的方法。本发明的发明目的是通过提供一种系统,该系统将OCR装置和检索装置分离,采用永久性保持文字行提取、文字切出以及文字识别多重假说的文件(OCR读取假说文件)作为OCR的输出形式,构成以该OCR读取假说文件为基础进行关键词检索的机能,实现必要的文件检索和文件分类。 |
申请公布号 |
CN100351847C |
申请公布日期 |
2007.11.28 |
申请号 |
CN03104955.9 |
申请日期 |
2003.02.28 |
申请人 |
株式会社日立制作所 |
发明人 |
永崎健;丸川胜美;藤原茂之 |
分类号 |
G06K9/00(2006.01);G06F17/30(2006.01) |
主分类号 |
G06K9/00(2006.01) |
代理机构 |
北京银龙知识产权代理有限公司 |
代理人 |
郝庆芬 |
主权项 |
权利要求书1.由接收记载有文字的图像输入的图像输入装置、中央运算装置和外部记忆单元构成的一种OCR装置,其特征在于,其中所述中央运算装置从输入图像中提取文字行候补和文字切出候补,并对文字切出候补进行文字识别,将文字识别的结果、文字行候补以及文字切出候补组合成读取假说文件,并记忆在所述的外部记忆单元中。 |
地址 |
日本东京都 |