发明名称 数据库敏感信息探测方法及系统
摘要 本发明涉及信息安全技术领域,旨在提供数据库敏感信息探测方法及系统。该数据库敏感信息探测方法包括步骤:扫描数据库的系统视图,获取所有的用户表,对每一个用户表每个字段抽取一部分数据做为样本,对样本进行分析匹配,判断是否是敏感信息;该数据库敏感信息探测系统包括系统表、扫描模块、判断模块和显示模块,扫描模块和数据库连接,判断模块分别与敏感信息特征库、扫描模块相连,判断模块与显示模块连接。本发明基于正则表达特征库,通过特征库对数据库里的用户数据进行扫描探测,能够发现手机号、银行卡号、身份证号以及邮箱等敏感信息所在的位置,并提供详细的扫描报告,使数据库管理员能够重点防护和审计。
申请公布号 CN104123370A 申请公布日期 2014.10.29
申请号 CN201410356492.8 申请日期 2014.07.24
申请人 杭州安恒信息技术有限公司 发明人 刘海卫;范渊
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州中成专利事务所有限公司 33212 代理人 周世骏
主权项 数据库敏感信息探测方法,其特征在于,具体包括下述步骤:(1)扫描数据库的系统视图,获取所有的用户表;(2)对每一个用户表每个字段抽取一部分数据做为样本;(3)对样本进行分析匹配,判断是否是敏感信息;所述步骤(1)具体包括下述步骤:步骤A:连接数据库;步骤B:用SELECT语句获取数据库的系统视图里,数据库所有的表名,并排除系统表,剩下用户表;步骤C:将步骤B中获得的用户表列表返回;所述步骤(2)具体包括下述步骤:步骤D:在步骤C返回的用户表列表中,取一个用户表名;步骤E:用SELECT语句和分页查询的方法,获取步骤D中选取的用户表中所有字段的部分数据;所述部分数据是指取一个表开头的N条记录;步骤F:将步骤E中获取的所有字段的部分数据,作为样本数据返回;所述步骤(3)具体包括下述步骤:步骤G:取步骤F返回的一个字段的样本数据;步骤H:对步骤G中选取的样本数据,采用正则表达式匹配的方法判断样本数据是否属于敏感信息,判断方法为:如果样本数据全部跟敏感信息特征库中的敏感信息匹配,认为样本数据是敏感数据字段,得出判断结果是;如果样本数据跟敏感信息特征库中的敏感信息不低于80%的比例匹配,得出判断结果疑是;如果样本数据跟敏感信息特征库中的敏感信息全部不匹配或者低于20%的比例匹配,则得出判断结果否;步骤I:循环执行步骤D、步骤E、步骤F、步骤G、步骤H,直至完成对步骤C返回的所有用户表进行判断,然后将步骤H中得出的判断结果返回,并显示包含有判断结果的扫描报告,且当判断结果为疑是或者是时,扫描报告中还包括敏感信息字段清单。
地址 310051 浙江省杭州市滨江区通和路浙江中财大厦15层