发明名称 地图影像资料之图文分离方法
摘要 一种可将地图影像资料中之图文分离出来的方法,此方法不论地图上文字的大小、方向,甚至连「图文黏接」与「图文重叠」等情形都可以有效的解决,此法系藉由将骨架图形 (Skeleton) 中所撷取的特征点,做群聚性的计算(Clustering),再根据群聚密度予以分类,决定是「文字群聚」或是「线条群聚」,我们所采用的群聚性计算法则是最大一最小距离群聚法则 ( Max - MinDistance Clustering Algorithm ),分类出来的文字可以接着作文字辨识,而图形可做向量化。
申请公布号 TW319856 申请公布日期 1997.11.11
申请号 TW084107775 申请日期 1995.07.27
申请人 财团法人资讯工业策进会 发明人 王景裕;施保旭;陈良华;赵象华;谢祯冏
分类号 G06T3/00 主分类号 G06T3/00
代理机构 代理人 陈长文 台北巿敦化北路二○一号七楼
主权项 1.一种图文分离之方法,用以使经电脑扫描处理后之地图影像上之文字与图形分离出来,该方法包含下列步骤:(1)一前置处理步骤,包含:(a)二値化处理,此步骤系依据灰阶与点数的统计图形选择一临界値,依灰阶临界値比较,设定为黑点或白点;(b)细线化处理:将经过二値化处理后之地图影像做细线化处理;以及(c)修补细线化处理后之扭曲、冗点等之校正。(2)图影像的特征点撷取,该地图影像之特征点定义为一黑点,各特征点之间依影像出现的方式分为预设数目之多种型式,该地图影像的特征点之撷取是以一3x3的遮幕(mask)检查该特征点的型式,并予以归类;(3)将影像中之文字块抽取出来,该步骤系利用特征点的座标値计算各特征点的群聚性,然后将群聚性比较大的特征点群归纳于同一个群聚,若该同一群聚中之特征点个数大于"群聚密度临界値",则该群聚被归类为文字群聚,否则视为线条图形之群聚;该群聚性计算之步骤系依据最大-最小群聚法则,其所用到的参数起初群聚中心之选取是针对所有特征点之中距离最远的两点,且参数群聚半径的大小设为最小字型的平均高度;和(4)将文字群聚自地图影像中分离后,将剩下的线条图型群聚的特征点连接起来。2.根据申请专利范围第1项之方法,其中该"群聚密度临界値"为3。3.根据申请专利范围第1项之方法,其中步骤(4)之连接方式系采用双向追的方式,以避免任一特征点被归类为文字群聚而产生错误。4.根据申请专利范围第1项之方法,其中步骤(4)尚包含一图形修补步骤,该步骤系包含:(1)定任两线段端点之向量为基准;(2)求该向量基准与其他邻近的线段向量之内积,并求出其夹角;和(3)夹角最小者即进行修补。5.根据申请专利范围第1项之方法,其中该特征点型式是以一个33遮罩,满足degree=1,3或4的点。图示简单说明:第一图系本发明流程方块图第二图系第一图中前置处理之细部流程图第三A图系第二图中二値化处理之实例原图第三B图系第三A图之二値化之结果第四图系第二图中细线化结果所用的链结码表示法第五图系第一图中图文分离之细部流程图第六图系定义第五图中特征点种类第七图系用以说明文字是一个一个的特征点群聚第八图系说明第五图之群聚分类会因归类错误导致线段AB消失第九图系说明第五图之线段修补是采用分枝追踪之法第十图系说明第五图之线段修补之对象是采夹角最小者(d1>d2>d3)第十一A图系本发明实施例之输入地图影像第十一B图系第十一A图之细线化图像第十一C图系第十一B图经细线化修补之结果第十一D图系第十一C图中所抽取之特征点第十一E图系第十一C图经文字抽取后所剩之线条图像第十一F图系第十一E图经线段修补之结果
地址 台北巿大安区和平东路二段一○六号十一楼