发明名称 机密信息的检测
摘要 检测机密信息包括读取存储的数据和识别所述存储的数据内的字串(210),其中每个字串包括连续字节的序列,所述字节全部具有在可能值的预定子集中的值。对于至少一些字串中的每一个,确定所述字串是否包括表示一个或多个格式匹配(220-270)的字节,其中格式匹配包括匹配与机密信息关联的预定格式的值的集合。对于每个格式匹配,利用与所述机密信息关联的规则集合测试匹配预定格式的值,以确定所述格式匹配是否是包括一个或多个无效值的无效格式匹配,以及至少部分地基于无效格式匹配的计数对其它格式匹配的计数的比值,计算所述存储的数据的得分(280,300)。
申请公布号 CN105426756A 申请公布日期 2016.03.23
申请号 CN201510510773.9 申请日期 2009.10.01
申请人 起元技术有限责任公司 发明人 戴维.福尼尔
分类号 G06F21/55(2013.01)I;G06F17/30(2006.01)I 主分类号 G06F21/55(2013.01)I
代理机构 北京林达刘知识产权代理事务所(普通合伙) 11277 代理人 刘新宇
主权项 一种用于检测机密信息的方法,该方法包括:读取存储的数据;识别所述存储的数据内的字串,其中每个字串包括连续字节的序列,所述字节全部具有在可能值的预定子集中的值;应用一个或多个规则的第一集合来基于字串识别一个或多个格式匹配,其中每个格式匹配包括匹配与第一类型的机密信息关联的预定格式的字串之一的至少一部分;对于所确定的每个格式匹配,利用与所述第一类型的机密信息关联的一个或多个规则的第二集合测试各个格式匹配,以确定所述格式匹配是否是无效格式匹配,在该无效格式匹配中,匹配预定格式的字串之一的部分包括一个或多个对于所述第一类型的机密信息无效的无效值;确定无效格式匹配的第一计数;确定不包括对于所述第一类型的机密信息无效的无效值的格式匹配的第二计数,其中通过一个或多个规则的第一集合识别格式匹配,并且通过一个或多个规则的第二集合确定格式匹配是否包括无效值;至少部分地基于比值计算所述存储的数据的第一得分,该比值是所述无效格式匹配的第一计数和不包括对于所述第一类型的机密信息无效的无效值的所述格式匹配的第二计数的函数;以及基于所述第一得分检测机密信息。
地址 美国马萨诸塞州