发明名称 用以在文件处理系统中精确辨识本文字体之系统及方法
摘要 一种精确辨识在一影像(17)中之本文字体的系统(100)及方法(100)产生被该影像(17)中之一字体所代表之字体字元的一位元地图,并比较(140)比位元地图与储存在一记忆体(22)内之字元的位元地图(120,130)。统计量(150)就该等字元对最佳配对之字体被收集,其数量足以确定最普遍会发生的字体。然后该最普遍会发生的字体由记忆体(22)中之所有字体(110)被选择以代表该原始的影像(17)。
申请公布号 TW565803 申请公布日期 2003.12.11
申请号 TW089101191 申请日期 2000.01.25
申请人 惠普公司 发明人 雷蒙德W 史密斯
分类号 G06K9/78 主分类号 G06K9/78
代理机构 代理人 恽轶群 台北市松山区南京东路三段二四八号七楼;陈文郎 台北市松山区南京东路三段二四八号七楼
主权项 1.一种用以辨识文件处理系统中之本文字体的系统(11),包含:一具有一记忆体(22)之电脑系统(15),其中包含数种字体(110),该电脑系统(15)亦包括一文件处理系统(36);用以接收该文件处理系统(36)中之一影像(17)之装置(19),该影像(17)包括数个代表该影像(17)中之一字体的本文字元;用以捕取每一该本文字元之装置(19),每一该本文字元系以一位元映像定义;一用以比较该捕取本文字元之该位元映像与包含于该电脑系统(15)内之每一该等数种字体(110)的一位元映像(120.130)的矩阵匹配器(140);以及用以自由该记忆体(22)而来之该等数种字体(110)中选择最接近地与该影像(17)中之该字体匹配的该字体的装置。2.如申请专利范围第1项所述之系统(11),其中该等本文字元系包封于字元限界盒(62.72)内。3.如申请专利范围第1项所述之系统(11),其中该矩阵匹配器(140)更包括用以逐一像素地比较该每一被捕取本文字元之一位元映像与包含于该电脑系统(15)内之每一该等数种字体(110)之一位元映像(120.130)之装置。4.如申请专利范围第1项所述之系统(11),其中该电脑系统(15)储存包含于该记忆体(22)中之每一该字体(130)的一描述,并提供一对应于该记忆体(22)中之该字体(130)之位元映像。5.一种用以辨识影像(17)中之本文字体的方法,包含下列步骤:将数种字体(110)储存于具有一记忆体(22)之一电脑系统(15)内,该电脑系统(15)亦包括一文件处理系统(36);接收一文件处理系统(36)中之一影像(17),该影像包括数个代表该影像(17)中之一字体的本文字元;捕取(19)每一该本文字元;就每一该本文字元获取一位元映像;使用一矩阵匹配器(140)比较该被捕取本文字元之该位元映像与包含于该电脑系统(15)中之每一该等数种字体(110)的一位元映像(120.130);以及自由该记忆体(22)而来之该等数种字体(110)中选择最接近地与该影像(17)中之该字体匹配之该字体。6.如申请专利范围第5项所述之方法,其中该等本文字元系包封于字元限界盒(62.72)内。7.如申请专利范围第5项所述之方法,其中该步骤(140)更包括逐一像素地比较该每一被捕取本文字元之一位元映像与包含于该电脑系统(15)内之每一该等数种字体(110)之一位元映像(120.130)之该步骤。8.如申请专利范围第5项所述之方法,其中该电脑系统(15)储存包含于该记忆体(22)中之每一该字体(130)的一描述,并提供一对应于该记忆体(22)中之该字体之位元映像。9.一种具有程式之电脑可读取媒体,用以辨识一影像中之本文之该字体,该程式包含被组配以实施下列步骤之逻辑(100):将数种字体(110)储存于具有一记忆体(22)之一电脑系统(15),该电脑系统(15)亦包括一文件处理系统(36);接收一文件处理系统(36)中之一影像(17),该影像包括数个代表该影像(17)中之一字体的本文字元;捕取(19)每一该本文字元;就每一该本文字元获取一位元映像;使用一矩阵匹配器(140)比较该被捕取本文字元之该位元映像与包含于该电脑系统(15)中之每一该等数种字体(110)的一位元映像(120.130);以及由该记忆体(22)之该等数种字体(110)中选择(100)最接近地与该影像(17)中之该字体匹配的该字体。10.如申请专利范围第9项所述之电脑可读取媒体,其中该步骤(140)更包括逐一像素地比较该每一被捕取本文字元之一位元映像与包含于该电脑系统(15)内之每一该等数种字体(110)之一位元映像(120.130)。图式简单说明:第1图为一方块图,说明包括有本发明之字体辨识逻辑的电脑系统;第2图为一方块图,进一步说明第1图之字体辨识逻辑;第3图为一示意图,说明可用以辨别二不同字体之少数几个字体属性;第4图为一流程图,说明本发明之操作;以及第5图为说明被第1图之字体辨识逻辑所使用的字元限界盒图。
地址 美国