发明名称 |
表单识别方法和装置 |
摘要 |
本发明公开了一种表单识别方法和装置。其中,表单识别方法包括:接收访问指令;加载与访问指令相对应的网页;对加载的网页的网页代码进行扫描;判断扫描到的网页代码中是否包括属性为第一预设属性的元素;判断扫描到的网页代码中是否包括属性为第二预设属性的元素;若判断出扫描到的网页代码中包括属性为第一预设属性的元素,并且还包括属性为第二预设属性的元素,则确定加载的网页为表单网页。通过本发明,解决了现有技术中表单识别率较低的问题,进而达到了提高表单识别率的效果。 |
申请公布号 |
CN103034711A |
申请公布日期 |
2013.04.10 |
申请号 |
CN201210529911.4 |
申请日期 |
2012.12.10 |
申请人 |
北京金山安全软件有限公司;北京金山网络科技有限公司;贝壳网际(北京)安全技术有限公司;可牛网络技术(北京)有限公司 |
发明人 |
蔡磊;张骏;万振;傅盛;徐鸣;王昆 |
分类号 |
G06F17/30(2006.01)I;G06F9/445(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京康信知识产权代理有限责任公司 11240 |
代理人 |
吴贵明;张永明 |
主权项 |
一种表单识别方法,其特征在于,包括:接收访问指令;加载与所述访问指令相对应的网页;对加载的网页的网页代码进行扫描;判断扫描到的网页代码中是否包括属性为第一预设属性的元素,其中,所述第一预设属性对应的元素为密码元素;判断扫描到的网页代码中是否包括属性为第二预设属性的元素,其中,所述第二预设属性对应的元素为用户名元素;以及若判断出扫描到的网页代码中包括属性为所述第一预设属性的元素,并且还包括属性为所述第二预设属性的元素,则确定加载的网页为表单网页。 |
地址 |
100022 北京市朝阳区朝阳北路237号复星国际中心12层 |