发明名称 基于内容相关性的文件涉密内容检索、密级判定及标注方法
摘要 一种基于内容相关性进行涉密内容检索、密级确定及标注的方法,其主要是根据文档所属范围选择相应的涉密关键词及匹配规则库,通过对文档内容进行分词操作并构建语义关联网,准确而全面地查找出文档中的涉密信息,并依据定密规则库中的定密规则,对各个涉密信息点进行密级判定和加密处理,然后综合各个涉密信息点的密级给出整个文档的相应密级,最后,将相关的密级信息在文档中进行标注。该方法能够高效地查找文档中的涉密信息并准确地判断文档的密级,大大减少了人工定密的工作量,提高了定密工作和密级鉴定工作的效率,有效地防止定密过程中随意定密现象的产生,可以自动地学新的涉密关键词及匹配规则,从而不断的提高检索和密级判定的精度。
申请公布号 CN102819604B 申请公布日期 2015.06.10
申请号 CN201210296061.8 申请日期 2012.08.20
申请人 徐亮;谭煌 发明人 徐亮;谭煌
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 长沙正奇专利事务所有限责任公司 43113 代理人 何为;李宇
主权项 一种基于内容相关性进行涉密内容检索、密级确定及标注的方法,其特征在于依次包括以下步骤:A、加载步骤:加载文档所属范围的涉密关键词及匹配规则库、本体库和定密规则库;B、解析步骤:对文档中的文字进行分词操作,并解析出该文档所包含图片、视频、音频中隐含的信息;C、检索步骤:根据文档的分词结果和加载的所属范围的涉密关键词词库和本体库查找文档中的涉密关键词,得到文档中的涉密关键词,并利用基于内容相关性的语义检索,依次检索出文档中与找到的涉密关键词有内容相关性的词语、句子和段落,将检索出的与涉密关键词有内容相关性的信息按其相关程度的大小,加入到有内容相关性的语义关联网中,得到语义关联网,再将语义关联网中构建的关系与涉密匹配规则库的规则比较,检索出涉密的语句、段落;D、密级确定步骤:根据检索结果和所属范围的定密规则库,确定文档中涉密内容的密级;E、标注步骤:对文档中确定了密级的涉密内容进行标注,生成标注文档。
地址 410081 湖南省长沙市湖南师范大学数学与计算机科技学院
您可能感兴趣的专利