发明名称 |
一种表格分析编改加工方法 |
摘要 |
本发明公开了一种表格分析编改加工方法,所述方法包括:扫描文档、并对扫描后的文档图像进行处理;对扫描处理后的图像通过表格版面分析算法生成表格版面,并对生成的表格版面进行分析调整;将扫描图像和调整后的版面信息分别传入识别软件进行双路识别和编改校对;对双路识别中有矛盾且重复出现两次以上的字进行纵向编改校对;对纵向编改后的字进行横向编改;根据表格版面信息和文字纵横向编改信息,合成电子表格文件。本发明对正常的纸质表格文档,编改效率可提高11倍,达到50万字/8小时;同时表格版面层次错误率低于3‰,编改文字错误率降低50%以上,低于0.5‰。 |
申请公布号 |
CN102855232A |
申请公布日期 |
2013.01.02 |
申请号 |
CN201210338748.3 |
申请日期 |
2012.09.14 |
申请人 |
同方光盘股份有限公司 |
发明人 |
张镔;王艳;梁洵;袁仁慧 |
分类号 |
G06F17/24(2006.01)I |
主分类号 |
G06F17/24(2006.01)I |
代理机构 |
北京捷诚信通专利事务所(普通合伙) 11221 |
代理人 |
魏殿绅 |
主权项 |
一种表格分析编改加工方法,其特征在于,所述方法包括:扫描文档、并对扫描后的文档图像进行处理;对扫描处理后的图像通过表格版面分析算法生成表格版面,并对生成的表格版面信息进行调整;将扫描图像和调整后的版面信息分别传入识别软件进行双路识别和编改校对;对双路识别中有矛盾且重复出现两次以上的字进行纵向编改校对;对纵向编改后的字进行横向编改;根据表格版面信息和纵横向编改后的文字,合成电子表格文件。 |
地址 |
100084 北京市海淀区清华园清华大学36区华业大厦B1410、1412、1414室 |