发明名称 用于检测外发通信何时包含特定内容的方法和系统
摘要 提供了一种用于检测外发通信是否包含机密信息或其它目标信息的方法和系统。检测系统带有包含机密信息的文档集合,称为“机密文档”。当向检测系统提供外发通信时,该系统把外发通信的内容与机密文档的内容相比较。如果外发通信包含机密信息,则检测系统就防止在机构外部发送该外发通信。检测系统基于外发通信内容和已知包含该机密信息的机密文档的内容之间的相似性来检测机密信息。
申请公布号 CN1716294B 申请公布日期 2013.09.11
申请号 CN200510082404.0 申请日期 2005.06.30
申请人 微软公司 发明人 B·章;H-J·曾;马维英;陈正
分类号 G06F17/30(2006.01)I;G06F21/62(2013.01)I;H04L12/58(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海专利商标事务所有限公司 31100 代理人 胡利鸣
主权项 计算机系统中一种用于标识外发通信是否包含机密信息的方法,所述方法包括:提供包含机密信息的文档;生成一个把关键词映射到包含所述关键词的文档的关键词索引,其中关键词是其所计算的重要性大于一重要性阈值的单词;生成一个把关键句的哈希码映射到包含所述关键句的文档的句子哈希表,其中对于包含所述关键句的文档的每个段落,所述段落中其关键词与该段落关键词最为相似的句子被标识为该段落的关键句;接收外发通信;标识所述外发通信的关键词;基于所述文档的关键词和所述外发通信的所标识的关键词之间的相似性使用生成的关键词索引来定位候选文档;生成所述外发通信的关键句哈希码;使用生成的句子哈希码以标识那些包括其哈希码与生成的所述外发通信的关键句哈希码相同的关键句的候选文档;将所标识的候选文档的关键句与所述外发通信的关键句进行比较;以及在确定所述外发通信的至少一阈值条关键句与所标识的候选文档的关键句匹配后,将所述外发通信标记为包含机密信息。
地址 美国华盛顿州