发明名称 验证码识别方法和装置
摘要 本发明公开了一种验证码识别方法和装置,所述方法包括:获取网站网页中的待识别验证码图像,根据其边缘像素点的灰度值的平均值对待识别验证码图像进行二值表示;对二值表示后的待识别验证码图像进行降噪处理,并从中切割出每个待识别验证码字符的图像;对于切割出的每个待识别验证码字符的图像,构建该待识别验证码字符的二值矩阵,进而确定该待识别验证码字符的特征向量;计算该待识别验证码字符的特征向量与特征码库中的各字符的标准特征向量之间的距离,并将与该待识别验证码字符的距离最小的标准特征向量所对应的字符作为识别出的验证码字符。应用本发明可以实现网站网页中的验证码识别,以对网站网页进行安全性检测或者进行自动化测试。
申请公布号 CN104021376A 申请公布日期 2014.09.03
申请号 CN201410246783.1 申请日期 2014.06.05
申请人 北京乐动卓越科技有限公司 发明人 金巍巍
分类号 G06K9/00(2006.01)I;G06F21/36(2013.01)I 主分类号 G06K9/00(2006.01)I
代理机构 北京市京大律师事务所 11321 代理人 张璐;方晓明
主权项 一种验证码识别方法,其特征在于,包括:获取网站网页中的待识别验证码图像;判断所述待识别验证码图像的边缘像素点的灰度值的平均值是否大于设定灰度阈值;若是,则将所述待识别验证码图像中灰度值不大于设定灰度阈值的像素点用1表示,灰度值大于设定灰度阈值的像素点用0表示;否则,将所述待识别验证码图像中灰度值大于设定灰度阈值的像素点用1表示,灰度值不大于设定灰度阈值的像素点用0表示;对二值表示后的待识别验证码图像进行降噪处理后,采用切割算法从降噪处理后的待识别验证码图像中切割出每个待识别验证码字符的图像;对于切割出的每个待识别验证码字符的图像,根据该待识别验证码字符的图像中的各像素点的表示数值,构建该待识别验证码字符的二值矩阵,进而确定出该待识别验证码字符的特征向量;对于每个待识别验证码字符,计算该待识别验证码字符的特征向量与特征码库中的各字符的标准特征向量之间的距离,并将与该待识别验证码字符的距离最小的标准特征向量所对应的字符作为识别出的验证码字符。
地址 100041 北京市石景山区八大处高科技园区西井路3号3号楼9077房间