发明名称 表单资料之自动更正方法与系统
摘要 本发明揭露了一种表单资料的自动更正方法与系统。此方法与系统是以人工智慧的模式,将一群意义上相关连的资料关系建立成一个专家系统。当操作者进行校正时,本系统会根据专家系统推论的资料栏位错误讯息,统计各栏位的错误次数,再将其依据错误次数排序。接着优先更正错误次数最多的栏位,首先利用栏位本身特性做更正,之后再利用原始的字元辨识的候选字进行更正。更正完毕后,本系统会检查资料栏位的错误数目是否收歛,若收歛则继续进行下一个栏位的更正直到错误数目为O。至于无法自动更正的错误栏位,则显示于使用者界面之输出装置上,以供人力直接进行校正而完成校正该资料的程序。
申请公布号 TW442761 申请公布日期 2001.06.23
申请号 TW088109760 申请日期 1999.06.11
申请人 财团法人工业技术研究院 发明人 孙仲佑;黄雅轩;黄百纲;许秉凯
分类号 G06K9/03 主分类号 G06K9/03
代理机构 代理人
主权项 1.一种表单资料自动更正方法,该方法包括下列步骤:输入一群表单,该群表单具有复数个栏位,并具多个有特定关连性的栏位子集合资料,每个栏位具特定之栏位字元値;检查上述栏位的栏位字元値是否落在对应之定义范围内,且更正位于该定义范围之外的部份不合理栏位;及利用一专家系统自动校正该群表单之所有栏位。2.如申请专利范围第1项所述之表单资料自动更正方法,其中更正部份不合理栏位値之步骤,复包括:判断上述不合理栏位是否具有相对应之一提示符号;当上述不合理栏位具有上述提示符号时,以上述提示符号所对应値,更正上述不合理栏位;且当上述不合理栏位不具有上述提示符号时,以上述不合理栏位之一候选字元,更正上述不合理栏位。3.如申请专利范围第1项所述之表单资料自动更正方法,其中以专家系统校正所有栏位之步骤,复包括:利用一检误规则检查该群表单栏位,产生一第一检误规则-错误栏位对照表,该检误规则-错误栏位对照表具一错误栏位项,放置有错误栏位讯息,一检误规则项,放置与该错误栏位项内的错误栏位讯息相对应之检误规则则讯息;且依据该第一检误规则-错误栏位对照表,一一更正错误栏位。4.如申请专利范围第3项所述之表单资料自动更正方法,其中产生第一检误规则-错误栏位对照表的步骤,复包括:检查该群表单中上述子集合资料,找出错误栏位;统计各个错误栏位之个别错误次数;以该检误规则检查该子集合资料之间的错误关系;累计各个错误栏位之个别错误次数;并扣除因栏位空白所产生的错误次数,产生各个错误栏位的栏位错误数目,将所有错误栏位的栏位错误数目相加产生第一加总错误次数。5.如申请专利范围第4项所述之表单资料自动更正方法,其中复包括:(1)依据该第一检误规则-错误栏位对照表更正完一错误栏位后,再产生具上述错误栏位项与检误规则项之第二检误规则-错误栏位对照表,重新计算各个错误栏位的栏位错误数目,并统计所有错误栏位的第二加总错误次数;(2)若该第二加总错误次数为零,则已完成所有栏位之校正,结束自动更正程序;(3)若该第二加总错误次数大于该第一加总错误次数,则回复上一次更正前之资料状态,显示无法自动更正的错误栏位于一使用者界面上,并经由该使用者界面校正上述无法自动更正的栏位,结束自动更正程序;以及(4)若该第二加总错误次数小于该第一加总错误次数,则让该第二检误规则-错误栏位对照表成为该第一检误规则-错误栏位对照表,重复步骤(1)至(4)。6.如申请专利范围第4或5项所述之表单资料自动更正方法,其中系按照各个错误栏位的栏位错误数目由大至小依序一一更正错误栏位。7.如申请专利范围第6项所述之表单资料自动更正方法,其中之第一检误规则-错误栏位对照表内尚包括一栏位错误数目项,放置上述错误栏位项内之错误栏位的栏位错误数目。8.如申请专利范围第5项所述之表单资料自动更正方法,其中之第二检误规则-错误栏位对照表内尚包括一栏位错误数目项,放置上述错误栏位项内之错误栏位的栏位错误数目。9.如申请专利范围第3或5项所述之表单资料自动更正方法,其中一一更正错误栏位的步骤,复包括:(1)当该错误栏位具有一提示符号时,以该检查符号之对应値更正该错误栏位,并结束该错误栏位更正程序;(2)当该错误栏位不具有该提示符号时,则以该错误栏位的第一顺位候选栏値更正该错误栏位;(3)以该错误栏位对应之检误规则分析正确性;(4)当上述检误规则判断该错误栏位之更正为正确时,结束该错误栏位更正程序;(5)当上述检误规则判断该错误栏位之更正为错误时,以该错误栏位的下一顺位候选栏値更正该错误栏位,重复步骤(3)至(5)直到该错误栏位的所有候选栏値皆选过为止;并(6)若全部候选栏値皆选过仍有错误,回复该错误栏位为更正前原始栏値。10.如申请专利范围第9项所述之表单资料自动更正方法,其中复包括下列步骤:(1)选取只与该错误栏位共组成一条检误规则的一共轭错误栏位;(2)当该共轭错误栏位具有上述提示符号时,以该提示符号之对应値更正该共轭错误栏位之値,并结束该共轭错误栏位更正程序;(3)当该共轭错误栏位不具有上述提示符号时,则以该共轭错误栏位的第一顺位候选栏値更正该共轭错误栏位;(4)以(1)所述之检误规则分析正确性;(5)当(4)分析出该共轭错误栏位之更正为正确时,结束该共轭错误栏位更正程序;以及(6)当(4)分析出该共轭错误栏位之更正为错误时,以该共轭错误栏位的下一顺位候选栏値更正该共扼错误栏位,重复步骤(4)至(6)直到该错误栏位的所有候选栏値皆选过为止。11.如申请专利范围第10项所述之表单资料自动更正方法,其中之候选栏値顺位之选取,系利用上述错误栏位中每一字元辨识所得候选字元组,每一候选字元组中之候选字依辨识把握度由高至低排顺位,分别自各候选字元组中依顺位取一候选字成为上述候选栏値,而辨识把握度最高者为上述第一顺位候选栏値。12.如申请专利范围第1项所述之表单资料自动更正方法,其中上述之一群表单中所有的栏位皆具有不同的编码,允许该专家系统进行跨越栏位、表单以及历史资料的更正程序。13.如申请专利范围第1项所述之表单资料自动更正方法,其中上述之检误规则系由该群表单的资料定义所得栏位间的关系学习而得。14.一种表单资料自动更正系统,该系统至少包括:一扫瞄装置,扫描输入的一表单资料,使成为一影像资料的形式;一辨识装置,自该影像资料撷取出该表单资料中栏位之栏位値,并对上述栏位値进行辨识,用以产生一辨识资料;一资料载体,提供系统中资料的存取空间;及一校正装置,校正该表单资料,该校正装置包括:一处理器,以一专家系统程序,依该表单资料之检误规则,校正该表单资料并自动更正其中错误栏位;和一使用者界面,具输出入装置,以供人工校正无法经由该专家系统程序自动更正之表单资料。15.如申请专利范围第14项所述之表单资料自动更正系统,其中之使用者界面至少包含下列输出配置区域:一资料影像显示区,提供该影像资料讯息;一辨识资料显示区,提供该辨识资料讯息;及一错误讯息显示区,提供该错误栏位之错误讯息。16.如申请专利范围第15项所述之表单资料自动更正系统,其中上述之输出配置区域复包含:一影像档案资讯区,提供影像之档案讯息、资料编号讯息;及一功能操作区,提供使用者操作此系统所需的功能。图式简单说明:第一图为传统上进行表单更正的资料处理流程图。第二图A为传统上表单更正系统中肇因于杂讯而导致字元辨识失败之示意图。第二图B为传统上表单更正系统中肇因于杂讯而导致字元辨识失败之另一示意图。第二图C为传统上表单更正系统中肇因于扫描影像偏差而导致字元辨识失败之示意图。第二图D为传统上表单更正系统中肇因于影像相连而导致字元辨识失败之示意图。第三图为本发明中针对表单进行辨识与表单校正之系统示意图。第四图为本发明中表单更正系统之专家系统处理资料流程图。第五图为本发明之专家系统中更正落于不合理范围中之栏位字元値的资料处理流程图。第六图为本发明之专家系统中分析整群具相关联性资料之流程图。第七图为本发明之专家系统中分析整群具相关联性资料时,所建立的错误栏位与检索规则之关系表。第八图为本发明之专家系统中自动更正不合理栏位之字元値的资料处理流程。第九图为本发明中进行表单栏位校正之使用者界面示意图。第十图为应用本发明技术之行政院人力资源普查的表单正面样本。第十一图为应用本发明技术之行政院人力资源普查的表单背面样本。第十二图为依据本发明精神所提出之一具体实施例中,进行表单栏位更正之使用者界面。第十三图为依据本发明精神所提出之另一具体实施例中,进行表单栏位更正之使用者界面。
地址 新竹县竹东镇中兴路四段一九五号