发明名称 基于BLSTM的联机手写数学公式符号识别方法
摘要 本发明提供基于BLSTM的联机手写数学公式符号识别方法,对联机手写输入的数学公式,用隐性分割模型对数学公式符号进行处理及识别,然后进行公式分析。本发明基于双向长短时记忆递归神经网络模型设计联机手写数学公式符号识别过程,并使用时域连接模型标注输出的无分割公式序列。对多部件构成的复杂符号,根据ASCII码表转化成单字符标签,减少识别标签的不确定性,统一标签类型。本发明联机手写数学公式符号识别方法识别效果良好,不需对公式进行切分处理,减少了一般公式识别方法中的工作量。多部件复杂符号整体识别的方法有效,比单独识别的准确率有显著提高。
申请公布号 CN105512692A 申请公布日期 2016.04.20
申请号 CN201510860618.X 申请日期 2015.11.30
申请人 华南理工大学 发明人 黄双萍;金连文;商俊蓓
分类号 G06K9/68(2006.01)I;G06N3/08(2006.01)I 主分类号 G06K9/68(2006.01)I
代理机构 广州粤高专利商标代理有限公司 44102 代理人 何淑珍
主权项 基于BLSTM的联机手写数学公式符号识别方法,其特征在于对联机手写输入的数学公式,用隐性分割模型对数学公式符号进行处理及识别,然后进行公式分析;具体包括如下步骤:1)联机手写数学公式预处理切分:预处理模块完成笔迹归一化,再进行重采样及时间序列上的特征提取,具体使用隐性分割模型,通过重采样得到时间序列上的简单分割,每个采样点为分割片断,不需要在预处理时对公式进行精确切分;2)标签置换:使用整体识别方法,对多部件特殊符号进行整体标注,利用ASCII码表中的空位,将多部件特殊符号转换为单字符表达标签;3)用双向长短时记忆递归神经网络‑时域连接分类器(BLSTM‑CTC)组合模型进行数学公式字符识别:通过双向长短时记忆神经网络(BLSTM)实现数学公式序列字符在一维空间上的识别,并通过时域连接分类器(CTC)连接技术,对无分割公式序列进行标签,使时间序列上的采样点标签可以匹配到真值序列标签,从而将字符级别的识别结果通过时域连接模型上升到序列级别。
地址 510640 广东省广州市天河区五山路381号