发明名称 多种印刷字体中文辨认装置
摘要
申请公布号 TW109770 申请公布日期 1989.03.11
申请号 TW076207350 申请日期 1987.07.31
申请人 中华电信股份有限公司电信研究所 发明人 朱荣华;林彰铿;张光耀;张耿豪;张贤鑐;刘灿雄;郑伯顺
分类号 G06F15/66;G06K9/00 主分类号 G06F15/66
代理机构 代理人 顾宪文 台北巿长安东路二段八一号六楼
主权项 1.一多种印刷体中文辨认装置,系可同时辨 别多种印刷体及不同大小中文字之装置将 中文之印刷资料由扫描输入装置送入电脑 ,经过文字辨认的过程而辨认出该字,并 可经由文字学习之过程,抽取文字特征纳 入辨认装置,而达到扩充原有中文字集之 字数,并使辨认多种印刷体中文字成为可 能,本创作组成部份包括有: 一主处理机,主控各模组之执行情形 ; 一扫描器,将欲辨认之印刷体中文文 字贸料转换成数位资料; 一扫描介面卡,作为主处理机与扫描 器间资料之传送; 一监视器,以显示结果字形; 一列表机,印制结果字形; 一文字特征学习装置,包括有一扫描 驱动器、一文字目标探测器、一切割器、 一特征抽取器、一运算处理器、一特征编 码器,其中扫描驱动器系将扫描器输入之 印刷体中文字形资料加以调整处理,以得 到电脑字形,其调整处理之过程,系首先 按照需要之解析度设定扫描器扫描时之解 析度,再将纸上每一点以0至255为范围 的灰暗度値表示之,再使用适应性临界値 法,将灰暗度値简化成为以0-1为范围 的数位影像资料 (即以"1"表黑点,以 "0"表白点),此数位影像资料经文字 目标探测器将找出每一行中每一电脑字之 所在位置,再经切割器将数位影像资料中 之每一中文字切割,并以指定之解析度存 入记忆体中,而得到一大小一致、规格统 一之电脑字,之后再以特征抽取器分析, 分析之后取出个别字形的特征,并可将其 它各种印制体字形分别抽取特征后予以累 加成另一种特征,依据此一特征以同时辨 认各种印刷体中文字形,经过上述过程之 后,最后步骤系由特征编码器执行编码, 即将字形特征由字码表转换为该字的内码 ,并贮存于记忆体中成为字库以供文字辨 认装置之用; 一文字辨认装置,包括有一预先处理 器、一特征抽取器、一比对辨识器、一比 对处理机、一解码器,此文字辨认装置之 功能系将输入纸张上的文字逐辨认出结果 ,以显示于蓝视器或列表机上;以及 一贮存记忆单元,贮存程式及资料; 其中扫描器透过一扫描介面卡将印刷体体 中文字形资料送至主处理机,而此主处理机 即透过滙流排与文字辨认装置或文字特征学 习装置进行辨认工作,贮存记忆单元内贮存 着文字之特征资料库及程式,以作为输入中 文字形特征比对之依据。2.依据请求专利部份第1 项所述之多种印刷 体中文辨认装置,其中特征抽取器,系由 一运算处理机、一程式记忆体、一资料记 忆体而透过滙流排界面与主处理机作资料 之传输,此特征抽取器将每一中文字分成 若干子区域 (例如8*8=64子区域),再 池定每一子区域内笔到之归属方向,而其 笔划之方向性 分别以D1.D2 、D3.D4四个数値资料表之,而非笔 划空白部份,以D5表示,以在m*n个 小区域得到m*n个方向资料。3.依据请求专利部份 第1项所述之多种印刷 字体中文辨认装置,其特征资料库,其结 构为每一中文字占64Bytes,每一中文字 以64Bytes来分别代表64个子区域之笔划 特征,而其方向性笔到 系分别用 不同位元代表,使得笔到特征经过编码过 程,转成一串以0及1来代表之数位特征 ,使得特征精简成只占用以位元为单位之 资料量,同时各种不同印刷体分别学习抽 取之笔钊特征以逻辑加法运算累加处理, 而构成特征资料库。图示简单说明: 第一图系本创作多种印刷字体中文辨认 系统之结构图。 第二图系本创作文字特征学习系统结构 图。 第三图系本创作文字刮分成m*n。 第四图系本创作多种字体特征抽取器结 构图。 第五图系本创作多种字体特征抽取器之 工作流程图。 第六图系本创作文字辨认系统结构图。 第七图系本创作字形比对辨认器结构示 意图。 第八图系本创作字形比对辨认器工作流 图。
地址 桃园县杨梅镇民族路三段五五一巷十二号