发明名称 一种纳税人资料图像采集云端处理方法
摘要 本发明提供一种纳税人资料图像采集云端处理方法,包括以下步骤:A.PC上的图像采集云端软件集成TWAIN兼容驱动实现,当扫描仪扫描图像后,图像采集云端软件通过内置的OCR组件将图像识别图像文本,将文本传递到物联网服务软件;B.物联网服务软件收到文本信息后,分析出该图像属于何种资料,并根据资料的种类将图像处理的算法,包括加密、压缩、去噪、格式、大小精度,传递到云端软件;C.云端软件接收到资料算法后,通过内置的图像处理组件,依照下载的算法进行图像处理;D.云端软件向云服务软件发起请求,通过HTTP方式将图像向云服务软件传递;E.云端软件由DHT网络组成,可实现对云服务软件的离散下载,并对通讯量进行排序和优化调整,减少对网络带宽的消耗。
申请公布号 CN102299953A 申请公布日期 2011.12.28
申请号 CN201110172580.9 申请日期 2011.06.24
申请人 浪潮齐鲁软件产业有限公司 发明人 徐宏伟;王俊杰;左少标
分类号 H04L29/08(2006.01)I;H04L29/06(2006.01)I;G06K9/20(2006.01)I;G06K9/00(2006.01)I 主分类号 H04L29/08(2006.01)I
代理机构 代理人
主权项 一种纳税人资料图像采集云端处理方法, 其特征在于包括以下处理步骤:A.客户端PC上的图像采集云端软件集成TWAIN兼容驱动,当扫描仪扫描图像后,图像采集云端软件通过内置的OCR组件将图像识别图像文本,将文本传递到物联网服务软件;B.物联网服务软件收到文本信息后,分析出该图像属于何种资料,并根据资料的种类将图像处理的算法,包括加密、压缩、去噪、格式、大小精度,传递到云端软件;C.云端软件接收到资料算法后,通过内置的图像处理组件,依照下载的算法进行图像处理;D.云端软件向云服务软件发起请求,通过HTTP方式将图像向云服务软件传递; E.云端软件由DHT网络组成,可实现对云服务软件的离散下载,并对通讯量进行排序和优化调整,减少对网络带宽的消耗;该方法的实现环境为客户端PC通过USB接口或高速SCSI接口连接扫描仪,并通过以太网或互联网连接物联网处理服务器和云计算处理服务器,客户端PC安装图像采集云端软件,物联网处理服务器安装物联网服务软件,云计算处理服务器安装云服务软件,其中:图像采集云端软件,包括1)TWAIN兼容驱动软件;2)图像OCR处理软件;3)DHT网络上传下载及反向代理软件;4)传输排序的通讯量调整软件;5)算法装卸软件,其中;1)TWAIN兼容驱动软件TWAIN兼容驱动采用USB接口适配,处理过程包括:1)加载Twain Source Manager,获得 DSM_Entry区域;2)启动Twain Source Manager;3)加载Twain the Source;4) 启动Twain the Source;5)适配Twain the Source;6)获得调整信号数据;7)识别传输信道命令格式;8)启动传输;9)完成传输;10)关闭TWAIN 会话;2)图像OCR处理软件采用业界常用的OCR软件,包括基于DSP版面分析或文字特征分析算法,最终实现对图像文字的提取;3)DHT网络上传下载及其反向代理软件云端软件需要对扫描的图像文件和OCR文本进行上传,以加载到云计算服务器上,采用DHT反向代理技术以提高传输速度,以最大化的利用ADSL网络传输的带宽耗用;云端软件采用DHT反向代理软件,提供向不同云服务端的分块上传,处理过程包括:(1)加载云服务server table;(2)测试连接速度,并排序;(3)读取图像和文本的分块节点位置和节点信息;(4)Upload各节点信息到servers table各云服务上;(5)更新server table;(6) 制定云服务Upload主节点;(7)启动UDP连接,按照更新后的server table进行上传;(8)完成传输;(9)关闭会话;云端软件浏览图像时,需要从云服务端下载图像或相关文本信息,此时采用DHT网络直接下载;4)传输排序的通讯量调整软件在云端软件通过DHT网络进行传输时,可能对网络带宽造成资源的冲突和浪费,此时应采用通讯量的调整软件,即Traffic Shaping,处理方法如下:(1)在内存建立ACK tables,采用hashtable进行存储;(2)当创建DHT网络传输包,封包ACK时,将该包的文件名、块位置和大小保存入ACK tables;(3)对ACK tables按照文件名进行排序;(4)每次启动块传输时,查询ACK tables进行传输;5)算法装卸软件算法装卸软件,在一定程度上类似沙盘软件,但当前的沙盘软件主要提供虚拟存储区域,而不能提供一个应用的自动计算环境;而算法装卸软件提供了一种适用于应用自动下载自动执行的环境,可根据服务端定制的算法要求,提供对应的算法服务,其处理过程包括:(1)在内存创建三个区域,算法加载区、算法析构区、算法执行区;(2)算法加载区,将网络下载的算法进行加载,分析语义结构,进行文本检验;(3)算法析构区,将算法文本进行拆解分析,形成指令集体;(4)算法执行区,利用常用的编译执行环境,包括VC、加载析构后的指令集和执行算法。
地址 250014 山东省济南市高新区科航路2877号