发明名称 |
图像中文字区域的定位方法及装置 |
摘要 |
本发明公开了一种图像中文字区域的定位方法,包括构建参数回归模型;通过所述参数回归模型生成与图像对应的文本空间分布参数;根据所述文本空间分布参数重构与所述图像对应的文字-非文字二值图像。本发明实施例还公开了一种图像中文字区域的定位装置。与现有技术相比,本发明实施例的技术方案,完全摒弃传统通过图像轮廓或者区域特征进行文字区域定位的方式,通过对图像更深层次的语义特征,图像文本空间分布参数,进行分析,对文字区域进行定位,不仅能够避免图像尺寸、字体、颜色、语种等对定位的干扰,使定位更加精准,更加鲁棒,而且该方法基于图像最基本的语义特征,能够适用于各种格式的图像,具有通用性。 |
申请公布号 |
CN106157284A |
申请公布日期 |
2016.11.23 |
申请号 |
CN201510151823.9 |
申请日期 |
2015.04.01 |
申请人 |
阿里巴巴集团控股有限公司 |
发明人 |
刘彬;刘扬;张洪明 |
分类号 |
G06T7/00(2006.01)I |
主分类号 |
G06T7/00(2006.01)I |
代理机构 |
北京弘权知识产权代理事务所(普通合伙) 11363 |
代理人 |
逯长明;许伟群 |
主权项 |
一种图像中文字区域的定位方法,其特征在于,包括:构建参数回归模型;通过所述参数回归模型生成与图像对应的文本空间分布参数;根据所述文本空间分布参数重构与所述图像对应的文字‑非文字二值图像。 |
地址 |
开曼群岛大开曼岛 |