发明名称 手写辨认之方法及装置
摘要 本发明揭露了一种基于次字元隐藏式马可夫模型的表意字元与其他字元的手写辨认系统之方法及装置。利用一序列的次字元模型,并使用次字元的二维几何配置模型,而建立表意字元的模型。遵循一组设计规则,而根据一实施例建立各次字元隐藏式马可夫模型。利用次字元顺序模型及次字元几何配置模型之组合,而辨认手写字元。
申请公布号 TW357313 申请公布日期 1999.05.01
申请号 TW086108508 申请日期 1997.06.18
申请人 国立大学系统科学学会;苹果电脑公司 美国 发明人 吴亦明;格雷斯H.劳登;詹姆士A.彼特门
分类号 G06F3/00;G06F17/20 主分类号 G06F3/00
代理机构 代理人 陈长文 台北巿敦化北路二○一号七楼
主权项 1.一种辨认手写字元之方法,包含下列各步骤:将一 手写 输入与该字元的一第一部分之一第一模型比较;以 及将该 手写输入与该字元的一第二部分之一第二模型比 较,其中 已界定该字元的该第二部分在时间上系在该第一 部分之后 。2.根据申请专利范围第1项之方法,其中该第一部 分是一 第一字根,且该第二部分是一第二字根。3.根据申 请专利范围第2项之方法,其中该第一模型是一 第一隐藏式马可夫模型,且该第二模型是一第二隐 藏式马 可夫模型,其中该第二模型被界定在时间上系在该 第一模 型之后。4.根据申请专利范围第3项之方法,其中该 手写字元是一 草书体手写字元,且其中该方法是一辨认手写字元 的连线 状态下之方法。5.根据申请专利范围第3项之方法, 其中该手写字元是一 印刷体字元。6.根据申请专利范围第5项之方法,其 中系预先处理该手 写字元,以便提供一草书体手写表示法,且该手写 输入是 该草书体手写表示法。7.根据申请专利范围第3项 之方法,又包含下列各步骤: 将该第一部分之一第一几何特征値与该第一部分 之一第一 几何模型比较;将该第二部分之一第二几何特征値 与该第 一几何模型比较。8.根据申请专利范围第7项之方 法,又包含下列各步骤: 将该第一部分之该第一几何特征値与该第二部分 之一第二 几何模型比较;将该第二部分之该第二几何特征値 与该第 二几何模型比较。9.根据申请专利范围第8项之方 法,其中该第一几何特征 値包含该手写字元的该第一部分的一中心之一平 均値,且 其中该第一几何模型包含该第一部分的复数个实 例的复数 个中心之一平均値。10.根据申请专利范围第1项之 方法,其中该第一部分包含 所辨认的一字根之一第一部分,且该第二部分将包 含所辨 认的该字根之一第二部分,其中通常首先书写该第 一部分 ,然后书写所辨认的另一字根之至少另一部分,然 后书写 该第二部分。11.根据申请专利范围第1项之方法, 其中该字元包含所辨 认的一第一字根及所辨认的一第二字根,且其中该 方法将 该第一模型用于所辨认的该第一字根及所辨认的 该第二字 根,而辨认该字元,且其中第一部分包含所辨认的 该第一 字根及所辨认的该第二字根,且其中通常在书写所 辨认的 该第一字根之前或之后书写所辨认的该第二字根 。12.一种辨认手写字元之方法,包含下列各步骤: 将一字 元的一第一部分之一第一几何特征値与该第一部 分之一第 一几何模型比较;将该字元的一第二部分之一第二 几何特 征値与该第一部分之该第一几何模型比较。13.根 据申请专利范围第12项之方法,其中该第一部分及 该第二部分是该字元的第一及第二字根。14.根据 申请专利范围第13项之方法,又包含下列步骤: 对各隐藏式马可夫模型的一字汇树执行一Viterbi搜 寻, 而将该手写字元分段,其中该等隐藏式马可夫模型 包含该 第一及第二字根之第一及第二模型。15.根据申请 专利范围第14项之方法,其中该第一及第二 模型被界定成遵循一特定的时间顺序。16.根据申 请专利范围第13项之方法,其中该第一几何特 征値包含该手写字元的该第一部分的一中心之一 平均値, 且其中该第一几何模型包含该第一部分的复数个 实例的复 数个中心之一平均値。17.一种辨认手写字元之方 法,包含下列各步骤:接收该 手写字元的一输入,其中系以多个笔画书写该手写 字元; 预先处理该输入,以便提供该手写字元的一个一笔 画手写 表示法。18.根据申请专利范围第17项之方法,其中 该预先处理步 骤包含下列步骤:在该输入中至少一次插入若干点 ,平滑 该等点,缩放该等点,并对该等点重新抽样。19.一 种产生一字根资料库以供用于手写字元的手写辨 认 之方法,该方法包含下列各步骤:将一第一模型储 存在一 电脑可读取的储存媒体,以供该字元的一第一部分 使用; 将一第二模型储存在该电脑可读取的储存媒体,以 供该字 元的一第二部分使用,其中该第一部分包含所辨认 的一字 根之一第一部分,且该第二部分包含所辨认的该字 根之一 第二部分,其中通常首先书写该第一部分,然后书 写所辨 认的另一字根之至少另一部分,然后书写该第二部 分。20.根据申请专利范围第19项之方法,其中该第 一模型是 该第一部分的一第一隐藏式马可夫模型,且该第二 模型是 该第二部分的一第二隐藏式马可夫模型,且其中该 第一模 型被界定成在时间上系在该第二模型之后。21.一 种产生一字根资料库以供用于手写辨认之方法,该 方法包含下列各步骤:将一第一模型储存在一电脑 可读取 的储存媒体,以供所辨认的一第一字根使用;将一 第二模 型储存在该电脑可读取的储存媒体,以供所辨认的 该第一 字根使用,其中系根据使用一字元中所辨认的该第 一字根 之方式,而使所辨认的该第一字根具有不同的形状 。22.根据申请专利范围第21项之方法,其中该第一 模型是 一第一隐藏式马可夫模型,且该第二模型是一第二 隐藏式 马可夫模型。23.一种产生一字根资料库以供用于 手写字元的手写辨认 之方法,该方法包含下列各步骤:将一第一隐藏式 马可夫 模型储存在一电脑可读取的储存媒体,以供该字元 的一第 一部分使用;将一第二隐藏式马可夫模型储存在该 电脑可 读取的储存媒体,以供该字元的一第二部分使用, 其中该 第二隐藏式马可夫模型被界定成在时间上系在该 第一隐藏 式马可夫模型之后。24.根据申请专利范围第23项 之方法,又包含下列各步骤 :储存该第一部分的一第一几何模型;储存该第二 部分的 一第二几何模型。25.根据申请专利范围第23项之 方法,其中该第一部分包 含所辨认的一字根之一第一部分,且该第二部分将 包含所 辨认的该字根之一第二部分,其中通常首先书写该 第一部 分,然后书写所辨认的另一字根之至少另一部分, 然后书 写该第二部分。26.根据申请专利范围第23项之方 法,其中该字元包含所 辨认的一第一字根及所辨认的一第二字根,且其中 该方法 将该第一模型用于所辨认的该第一字根及所辨认 的该第二 字根,而辨认该字元,且其中第一部分包含所辨认 的该第 一字根及所辨认的该第二字根,且其中通常在书写 所辨认 的该第一字根之前或之后书写所辨认的该第二字 根。27.一种数位处理系统,包含:一个用来输入手 写字元之 输入板;一个耦合到该输入板之滙流排;一个耦合 到该滙 流排之处理器;一个耦合到该滙流排之记忆体,该 记忆体 储存所要辨认的一字元的一第一部分之一第一模 型,并储 存该字元的一第二部分之一第二模型,其中该记忆 体储存 该第二模型的方式为:该第二模型被界定成在时间 上系在 该第一模型之后。28.根据申请专利范围第27项之 系统,其中该第一部分是 一第一字根,且该第二部分是一第二字根。29.根据 申请专利范围第28项之系统,其中该第一模型是 一第一隐藏式马可夫模型,且该第二模型是一第二 隐藏式 马可夫模型。30.根据申请专利范围第27项之系统, 其中该处理器将所 输入的一手写字元之一表示法与该第一模型比较, 然后与 该第二模型比较,而辨认所输入的该手写字元。31. 根据申请专利范围第30项之系统,其中该表示法是 一 经过预先处理的表示法,其方式为:如果所输入的 该手写 字元是一印刷体字元,则该经过预先处理的表示法 提供该 印刷体字元的一个一笔画手写表示法。32.根据申 请专利范围第30项之系统,其中该系统包含一 印刷电路体,该印刷电路体适于经由一电脑系统的 一扩充 连线而连接到该电脑系统。33.根据申请专利范围 第32项之系统,其中该滙流排及该 处理器都位于该印刷电路体上。34.根据申请专利 范围第30项之系统,其中该系统是一电 脑系统的一部分,该滙流排是一系统滙流排,且该 处理器 是该电脑系统的一中央处理单元。35.根据申请专 利范围第30项之系统,其中该记忆体又储 存该第一部分的一第一几何模型,并储存该第二部 分的一 第二几何模型。36.根据申请专利范围第35项之系 统,其中该处理器又将 该第一部分之一第一几何特征値与该第一几何模 型比较, 并将该第二部分之一第二几何特征値与该第一几 何模型比 较,而辨认所输入的该手写字元。37.根据申请专利 范围第36项之系统,其中该处理器对储 存在该记忆体的复数个隐藏式马可夫模型的一字 汇树执行 一Viterbi搜寻,其中该等复数个隐藏式马可夫模型 包含 该第一隐藏式马可夫模型及该第二隐藏式马可夫 模型。38.根据申请专利范围第27项之数位处理系 统,其中该第 一部分包含所辨认的一字根之一第一部分,且该第 二部分 将包含所辨认的该字根之一第二部分,其中通常首 先书写 该第一部分,然后书写所辨认的另一字根之至少另 一部分 ,然后书写该第二部分。39.一种数位处理系统,包 含:一个用来输入手写字元之 输入端;一个耦合到该输入端之滙流排;一个耦合 到该滙 流排之处理器;一个耦合到该滙流排之记忆体,该 记忆体 储存所要辨认的一第一字根之一第一模型,并储存 所辨认 的该第一字根之一第二模型,其中系根据使用一字 元中所 辨认的该第一字根之方式,而使所辨认的该第一字 根具有 不同的形状。40.根据申请专利范围第27项之数位 处理系统,其中该记 忆体储存预先分类资料及指令,用以自较大量的字 元中选 择n个最佳的字元。41.根据申请专利范围第36项之 数位处理系统,其中该记 忆体储存预先分类资料及指令,用以自较大量的字 元中选 择n个最佳的字元。42.一种存有可执行电脑程式指 令的电脑可读取之储存媒 体,当一数位处理系统执行该等电脑程式指令时, 将使该 系统执行下列各步骤:将一字元的一第一部分之一 第一几 何特征値与该第一部分之一第一几何模型比较;将 该字元 的一第二部分之一第二几何特征値与该第一部分 之该第一 几何模型比较。43.根拣申请专利范围第42项的电 脑可读取之储存媒体, 其中该第一部分及该第二部分是该字元的第一及 第二字根 ,且其中该媒体存有可执行之指令,当执行该等指 令时将 使系统执行下列步骤:利用对一群隐藏式马可夫模 型之搜 寻而分段该字元,其中该群隐藏式马可夫模型包含 该第一 及第二字根之第一及第二模型。44.根据申请专利 范围第43项的电脑可读取之储存媒体, 其中该第二模型被界定成在时间上系在该第一模 型之后。45.根据申请专利范围第42项的电脑可读 取之储存媒体, 其中该媒体存有可执行之指令,当执行该等指令时 将使系 统执行下列步骤:自较大量的字元中选择n个最佳 的字元 ,而预先分类n个最佳的字元。46.一种存有可执行 电脑程式指令的电脑可读取之储存媒 体,当一数位处理系统执行该等电脑程式指令时, 将使该 系统执行下列各步骤:将一手写输入与一字元的一 第一部 分之一第一模型比较;将该手写输入与该字元的一 第二部 分之一第二模型比较,其中已界定该字元的该第二 部分在 时间上系在该第一部分之后。47.根据申请专利范 围第46项的电脑可读取之储存媒体, 其中该第一模型是一第一隐藏式马可夫模型,且该 第二模 型是一第二隐藏式马可夫模型,其中该第二模型被 界定在 时间上系在该第一模型之后。48.根据申请专利范 围第46项的电脑可读取之储存媒体, 其中该媒体存有指令,当执行该等指令时将使系统 执行下 列步骤:将该第一部分之一第一几何特征値与该第 一部分 之一第一几何模型比较;将该第二部分之一第二几 何特征 値与该第一几何模型比较。49.根据申请专利范围 第46项的电脑可读取之储存媒体, 其中该字元包含所辨认的一第一字根及所辨认的 一第二字 根,且其中系将该第一模型用于所辨认的该第一字 根及所 辨认的该第二字根,而辨认该字元,且其中第一部 分包含 所辨认的该第一字根及所辨认的该第二字根,且其 中通常 在书写所辨认的该第一字根之前或之后书写所辨 认的该第 二字根。50.根据申请专利范围第46项的电脑可读 取之储存媒体, 其中该媒体存有指令,当执行该等指令时将使系统 执行下 列步骤:自较大量的字元中选择n个最佳的字元,而 预先 分类n个最佳的字元。51.一种辨认手写字元之装置 ,包含:将一手写输入与该 字元的一第一部分的一第一模型比较之装置;以及 将该手 写输入与该字元的一第二部分之一第二模型比较 之装置, 其中已界定该字元的该第二部分在时间上系在该 第一部分 之后。52.根据申请专利范围第51项之装置,其中该 第一模型是 一第一隐藏式马可夫模型,且该第二模型是一第二 隐藏式 马可夫模型,且其中该第二模型被界定成在时间上 系在该 第一模型之后。53.根据申请专利范围第52项之装 置,包含:将该第一部 分的一第一几何特征値与该第一部分的一第一几 何模型比 较之装置;将该第二部分的一第二几何特征値与该 第一几 何模型比较之装置。图式简单说明:第一图A是本 发明的 整体方法之流程图,图中示出如何将不同的程序用 于训练 及辨认,以及如何使这些程序相关及相连。第一图 B示出 本发明的辨认程序之详细方法与步骤、以及这些 程序间之 相互关系。第二图示出一一般用途电脑系统的一 典型实施 例,该一般用途电脑系统可采用本发明,并可为本 发明的 一实施例。第三图示出本发明的一实施例,可将该 实施例 视为本发明的大致为一硬体之实施例。第四图示 出本发明 的一实施例,尤其示出本发明的系统内之某些组件 。第五 图示出根据本发明而设计一字根隐藏式马可夫模 型之一程 序。第六图A示出就一字元的各字根成分而对该字 元的辨 认定义,因而定义了所辨认的各字根。第六图B示 出根据 本发明而对第六图A所示同一中文字元的新字根辞 典定义 。第七图示出利用所辨认的字根"日"因形状改变 而产生根 据本发明的三个字根。第八图示出通常以一种以 上的字根 顺序方式写出的各种中文字元。第九图示出根据 本发明而 决定一个新界定字根的方向变化数之方法,用以计 算一特 定字根的字根隐藏式马可夫模型中之状态数。第 十图示出 根据本发明而自辞典产生的部分字汇树之两个实 例,其中 字元的字汇树描述是在字根层级,且利用该字汇树 描述来 产生各字根HMM之字汇树。第十一图示出根据本发 明而训 练各字根顺序HMM之一典型程序。第十二图示出根 据本发 明的预先处理部分之一内插法步骤。第十三图示 出一个用 来根据本发明而执行预先处理之平滑步骤。第十 四图示出 根据本发明而摘取字根顺序辨认所需的各参数。 第十五图 是根据本发明的一字根顺序辨认方法之流程图。 第十六图 是根据本发明的一几何配置训练方法之流程图。 第十七图 A示出对一草书手写字元的一分段。第十七图B示 出两个字 根之HMM,并示出根据本发明而在这两个字根之间分 段。 第十七图C示出在根据本发明的字元辨认中发生在 训练及 辨认一字根的各几何特征之各种量测。第十八图 示出根据 本发明的一几何配置辨认方法。第十九图示出将 所摘取的 各几何特征自一特定字根对映到一经过训练的特 定字根之 四个机率分布,以便根据本发明而执行几何配置辨 认。
地址 新加坡