发明名称 一种提取网页中验证码图片的方法
摘要 本发明提供了一种提取网页中验证码图片的方法。由于验证码图片在网页中并没有一个固定的网址链接,并且图片随机生成,对其进行刷新或者保存操作会改变图片内容,因此提取验证码图片是很多需要验证码图片的软件应用的一个关键难题。在该方法中,利用光标位置、验证码输入框位置、图片位置、图片大小、图片视觉与内容特征、图片关键字、图片长宽比例等信息将网页中的验证码图片提取出来。
申请公布号 CN102737122A 申请公布日期 2012.10.17
申请号 CN201210192428.1 申请日期 2012.06.08
申请人 浙江大学 发明人 卜佳俊;陈纯;韩冲;王灿;宋明黎;王炜;何占盈
分类号 G06F17/30(2006.01)I;G06F21/00(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州天正专利事务所有限公司 33201 代理人 王兵;黄美娟
主权项 一种提取网页中验证码图片的方法,其特征在于,包括以下步骤:1)获取浏览器当前活动页面所有IMG节点信息;2)根据预先制定的验证码图片评分策略,对IMG节点所包含的图片信息进行评分,评分最高的即为包含验证码图片的IMG节点;3)如果步骤2)无法获取所有IMG节点,则以验证码输入框为焦点截取其周围的局部图片将验证码图片包含在内;利用预先训练得到的分类检测模型获取验证码图片的具体位置;4)将验证码图片单独保存。
地址 310027 浙江省杭州市西湖区浙大路38号