从自然场景图像中识别多言语、多字体文字的方法,申请号CN201210241520.2-传众专利搜索

发明名称	从自然场景图像中识别多言语、多字体文字的方法
摘要	本发明公开了一种从图像中识别文字的方法，该方法从图像中提取特征点，并获得所述特征点的特征描述子，并对所获得的特征描述子进行筛选，根据筛选后的特征描述子所描述的特征点的位置和尺度信息，基于特征点生长多个候选区域，使每个候选区域中包含多个特征点。该方法还利用一个图片数据库训练得到一个分类器，利用该分类器对所述候选区域中的所有特征描述子进行分类，并根据该分类结果计算表示候选区域为文字区域的可能性参数，将所述可能性参数与一个阈值进行比较，以判断所述候选区域是否为文字区域，并对判断为文字区域的所述候选区域进行文字识别。本发明可以在各种困难条件下检测不同大小、颜色、字体、语言的文字。
申请公布号	CN102799879B	申请公布日期	2014.04.02
申请号	CN201210241520.2	申请日期	2012.07.12
申请人	中国科学技术大学	发明人	毛俊骅;李厚强;周文罡;田奇
分类号	G06K9/20(2006.01)I;G06K9/62(2006.01)I	主分类号	G06K9/20(2006.01)I
代理机构	中科专利商标代理有限责任公司 11021	代理人	宋焰琴
主权项	1.一种从图像中识别文字的方法，所述图像是包括多个像素点的电子图像，所述方法对图像中的文字区域进行定位并对文字区域中的文字进行识别，其特征在于，所述方法包括如下步骤：步骤A、从待识别图像中提取特征点，并获得所述特征点的特征描述子，所述特征描述子是用于描述特征点的算子；步骤B、以一个待筛选的特征描述子所描述的特征点的位置为圆心，该特征描述子的尺度为半径作圆，将所有在该圆中的特征点的特征描述子以其主方向投影到一个具有8个小区间的统计直方图中，所述8个小区间将全角度区间[0，2π]平均分成8份，如果有超过2个小区间中有投影到的特征描述子，则保留该特征描述子，否则筛除该特征描述子；接着，以一个待筛选的特征描述子所描述的特征点的位置为圆心，该特征描述子的尺度s1为半径作圆，得到位于在该圆内的除了该待筛选的特征描述子的n0个特征描述子，如果(n1+n2)/n0大于一个第一阈值，则筛除该特征描述子，否则保留该特征描述子，其中n1、n2分别为尺度小于s1×r1和大于s1×r2的特征描述子的个数，其中r1和r2是用来定义尺度过大和过小的具体参数，且满足r1<1、r2>1；步骤C、根据筛选后的特征描述子所描述的特征点的位置和尺度信息，基于特征点生长多个候选区域，使该每个候选区域中包含多个特征点，并且对于某个候选区域中任意一个特征点，必然存在属于这个候选区域的另一个特征点，使这两个特征点的距离小于其中一个特征点的尺度；步骤D、利用一个图片数据库训练得到一个分类器，所述图片数据库中包括多个样本图像，并在所述样本图像中已对文字区域进行了标定，利用该分类器对所述候选区域中的所有特征描述子进行分类，并根据该分类结果计算表示候选区域为文字区域的可能性参数；其中，在训练所述分类器时，对所述图片数据库中的每幅样本图像执行步骤A和步骤B相同的步骤；所述表示候选区域为文字区域的可能性参数为该候选区域中所有特征描述子的参数v的平均值<img file="FDA0000415345650000011.GIF" wi="92" he="71" />其中v=1表示该特征描述子为文字区域的特征点的特征描述子，v=-1表示该特征描述子为非文字区域的特征点的特征描述子；步骤E、将所述可能性参数与一个第二阈值进行比较，以判断所述候选区域是否为文字区域，并保留判断为文字区域的候选区域；步骤F、对判断为文字区域的所述候选区域进行文字识别。
地址	230026 安徽省合肥市包河区金寨路96号