发明名称 网络内容安全管理中一种敏感信息模板构建方法
摘要 本发明公开了网络内容安全管理中一种敏感信息模板构建方法,能够增强模板生成速度的同时,提高敏感信息模板在该类文本信息语义表达方面的准确性。该方法采用遗传算法进行模板构建,按照设定的分块长度K,对当前种群中每个染色体个体编码串按照编码位从左至右进行分块,并以分块为单位进行染色体的交叉和变异操作。
申请公布号 CN103793747B 申请公布日期 2016.09.14
申请号 CN201410043993.0 申请日期 2014.01.29
申请人 中国人民解放军61660部队 发明人 高岩;王文彬;王小康
分类号 G06N3/12(2006.01)I;H04L29/06(2006.01)I 主分类号 G06N3/12(2006.01)I
代理机构 北京理工大学专利中心 11120 代理人 温子云;仇蕾安
主权项 网络内容安全管理中一种敏感信息模板构建方法,其特征在于,该方法包括:步骤1、选择一类敏感信息的训练文本集,该训练文本集中包括信息文本向量和多个训练文本;将每个训练文本转换为二进制编码串并且作为一个染色体个体,构成遗传算法初始种群;步骤2、计算初始种群中每个染色体个体的适应度值,并保存适应度值最高的染色体及其适应度值为最优染色体B1和最优适应度值f(B1);步骤3、按照设定的分块长度K,对当前种群中每个染色体个体的编码串按照编码位从左至右进行分块,得到n个分块;K的取值范围为3~5;步骤4、以分块为单位,依据交叉概率,对当前种群中的染色体个体进行交叉操作;步骤5、以分块为单位,依据变异概率,对交叉操作后新生成的染色体个体进行变异操作;步骤6、重复执行步骤4和步骤5,直至当前种群中最后一个染色体完成交叉操作和变异操作,得到新种群;步骤7:计算所述染色体新种群中每个染色体个体的适应度值;步骤8:根据本轮适应度值最高和最低的染色体,执行遗传算法中的精英保持策略,对所述最优染色体B1及其最优适应度值f(B1)进行替换;步骤9:判断算法迭代停止条件,如果停止,进入步骤10;否则,以新种群作为当前种群,返回步骤4;步骤10:从所述信息文本向量中提取最优染色体B1中的编码位1对应的关键词,构成敏感信息模板输出。
地址 100089 北京市海淀区半壁街南路2号