发明名称 一种图像中的文字定位方法和装置
摘要 本发明实施例公开了一种图像中的文字定位的方法和装置,该方法包括:将图像划分成图像块,并对所述图像块进行离散余弦DCT变换,得到所述图像块对应的DCT变换系数;根据所述图像块对应的DCT变换系数计算所述图像块的纹理能量差异程度值;确定图像中图像块纹理能量差异程度值的最大的值,根据所述图像块纹理能量差异程度值的最大值确定第一阈值;将纹理能量差异程度值大于或等于第一阈值的图像块标记为重要图像块;将重要图像块的组成的区域确定为文字区域。根据本发明实施例,能够提高检测文字区域的准确度。
申请公布号 CN101887520A 申请公布日期 2010.11.17
申请号 CN200910138672.8 申请日期 2009.05.12
申请人 华为终端有限公司 发明人 赵嵩;王静;刘源;李凯
分类号 G06K9/32(2006.01)I 主分类号 G06K9/32(2006.01)I
代理机构 深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人 彭愿洁;李文红
主权项 一种图像中的文字定位方法,其特征在于,包括:A.将图像划分成图像块,并对所述图像块进行离散余弦DCT变换,得到所述图像块对应的DCT变换系数;B.根据所述图像块对应的DCT变换系数计算表示所述图像块内各个子块之间的纹理能量值之间差异的纹理能量差异程度值;C.确定图像中图像块纹理能量差异程度值的最大值,根据所述图像块纹理能量差异程度值的最大值确定第一阈值;D.将纹理能量差异程度值大于或等于第一阈值的图像块标记为重要图像块;E.将重要图像块的组成的区域确定为文字区域。
地址 518129 广东省深圳市龙岗区坂田华为基地B区2号楼