发明名称 自然场景图像中手写体数学公式结构分析与识别方法
摘要 一种自然场景图像中手写体数学公式结构分析与识别方法,包括:S1,将自然场景图像的灰度矩阵转换为局部对比度矩阵,使用otsu法对得到的局部对比度矩阵进行二值划分,得到二值矩阵;S2,对步骤S1中二值矩阵进行连通域分析,剔除非字符连通域,得到字符连通域;S3,采用相关系数法对S2中的字符连通域进行公式特殊结构元素检测,并对所有检测到的特殊结构元素进行单独标注;S4,采用水平投影法对S1中的二值矩阵进行行划分;S5:采用卷积神经网络对每个字符连通域进行识别;S6,定义输出顺序,将识别结果按照对应的顺序,以latex排版格式进行输出。该方法有效地解决OCR识别中初等数学公式的表示问题。
申请公布号 CN105184292A 申请公布日期 2015.12.23
申请号 CN201510531070.4 申请日期 2015.08.26
申请人 北京云江科技有限公司 发明人 陈李江;刘宁;刘辉
分类号 G06K9/32(2006.01)I;G06K9/62(2006.01)I;G06N3/02(2006.01)I 主分类号 G06K9/32(2006.01)I
代理机构 北京博维知识产权代理事务所(特殊普通合伙) 11486 代理人 高萍
主权项 一种自然场景图像中手写体数学公式结构分析与识别方法,其特征在于,所述方法包括:步骤S1:将自然场景图像的灰度矩阵转换为局部对比度矩阵,使用otsu法对得到的局部对比度矩阵进行二值划分,得到二值矩阵;步骤S2:对步骤S1中二值矩阵进行连通域分析,剔除非字符连通域,得到字符连通域;步骤S3:采用相关系数法对步骤S2中的字符连通域进行公式特殊结构元素检测,并对所有检测到的特殊结构元素进行单独标注;步骤S4:采用水平投影法对步骤S1中的二值矩阵进行行划分;步骤S5:采用卷积神经网络对每个字符连通域进行识别;步骤S6:定义输出顺序,将识别结果按照对应的顺序,以latex排版格式进行输出。
地址 100083 北京市海淀区中关村东路16号龙湖唐宁8幢2801