发明名称 图像中文字区域的定位方法及装置
摘要 本发明公开了一种图像中文字区域的定位方法,包括构建参数回归模型;通过所述参数回归模型生成与图像对应的文本空间分布参数;根据所述文本空间分布参数重构与所述图像对应的文字-非文字二值图像。本发明实施例还公开了一种图像中文字区域的定位装置。与现有技术相比,本发明实施例的技术方案,完全摒弃传统通过图像轮廓或者区域特征进行文字区域定位的方式,通过对图像更深层次的语义特征,图像文本空间分布参数,进行分析,对文字区域进行定位,不仅能够避免图像尺寸、字体、颜色、语种等对定位的干扰,使定位更加精准,更加鲁棒,而且该方法基于图像最基本的语义特征,能够适用于各种格式的图像,具有通用性。
申请公布号 CN106157284A 申请公布日期 2016.11.23
申请号 CN201510151823.9 申请日期 2015.04.01
申请人 阿里巴巴集团控股有限公司 发明人 刘彬;刘扬;张洪明
分类号 G06T7/00(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 北京弘权知识产权代理事务所(普通合伙) 11363 代理人 逯长明;许伟群
主权项 一种图像中文字区域的定位方法,其特征在于,包括:构建参数回归模型;通过所述参数回归模型生成与图像对应的文本空间分布参数;根据所述文本空间分布参数重构与所述图像对应的文字‑非文字二值图像。
地址 开曼群岛大开曼岛