发明名称 基于可信计算和云计算的信息安全大数据资源管理系统
摘要 本发明公开了基于可信计算和云计算的信息安全大数据资源管理系统,包括数据资源存储单元、数据资源分类单元、基于可信计算的密钥单元、数据资源查找单元、任务规划单元、可信组合评估单元和服务部署单元。该系统架构是在具有保护性功能、认证和完整性度量等特征基础上构建一种可信度评估机制和可信关系传递机制,进而建立一个从数据资源存储到数据资源查找,再到数据资源服务分配的可信链。本发明实现了大数据资源的有效管理,增加了系统的安全性和可信性。
申请公布号 CN106203164A 申请公布日期 2016.12.07
申请号 CN201610525125.5 申请日期 2016.07.01
申请人 何钟柱 发明人 陈祖斌;谢铭;胡继军;翁小云;袁勇;邓戈锋;莫英红;谢菁;张鹏;唐玲丽;黄连月;郑俊明;欧阳喆;杭聪;宋骏豪
分类号 G06F21/62(2013.01)I 主分类号 G06F21/62(2013.01)I
代理机构 北京高航知识产权代理有限公司 11530 代理人 吴强
主权项 基于可信计算和云计算的信息安全大数据资源管理系统,其特征在于,包括数据资源存储单元、数据资源分类单元、基于可信计算的密钥单元、数据资源查找单元、任务规划单元、可信组合评估单元和服务部署单元,具体地:(1)数据资源存储单元:包括数据存储模块和数据备份模块,所述数据存储模块认证所需进行信息存储的网络中的硬件节点,判断网络硬件节点可信度,建立所存储信息的信任关系,建立信任关系后,以分布在云环境下的数据资源为基础,对数据资源进行封装存储;所述数据备份模块用于数据丢失或者遭到破坏的情况下恢复数据;(2)数据资源分类单元:用于采用K‑means聚类的方法对数据进行分类管理;(3)基于可信计算的密钥单元:用于保证数据不能被随意获取,包括基于可信技术设置的密钥生成模块、身份验证模块和解密模块;所述密钥生成模块具体执行以下操作:1)将数据划分为多个密钥字符串长度大小的块;2)用0~26范围的整数取代明文和密钥的每个字符,空格符=00,A=01,...,Z=26;3)对明文的每个块,将其每个字符用对应的计算值取代,所述对应的计算值为将对应字符的整数编码与密钥中相应位置的字符的整数编码相加后除27再取余所得到的值;4)将用对应的计算值取代的字符再用其等价字符替代;所述身份验证模块通过用户登录和指纹验证实现;身份验证成功的用户即可通过解密模块获得密钥,完成解密;(4)数据资源查找单元:用于根据大数据服务的需求,在已验证的安全网络环境下从数据资源层中分散在云中各处的数据资源提供者处查找并匹配满足应用需求的数据资源,并通过搜集整理形成待处理的大数据资源,作为大数据服务的输入;包括依次连接的建模模块、资源复制模块和资源查找模块,所述建模模块用于采用非结构化对等网络对云环境下的资源节点形成的覆盖网络进行建模,所述资源复制模块用于在所述覆盖网络中的各邻居节点之间进行资源信息的复制,所述资源查找模块用于查找并匹配满足应用需求的数据资源;设x<sub>i</sub>为非结构化对等网络中的一个对等节点,{x<sub>i1</sub>,x<sub>i2</sub>,…x<sub>im</sub>}为x<sub>i</sub>的邻居节点集,<img file="FDA0001039170200000011.GIF" wi="65" he="63" />为本地资源池,<img file="FDA0001039170200000012.GIF" wi="61" he="63" />为邻居节点资源信息池,i∈[1,n],n为对等网络包含节点的总数,m表示邻居节点的个数,m<n;A、所述资源复制模块在进行资源信息的复制时采用基于邻居节点间的数据资源信息主动复制协议:当x<sub>i</sub>加入覆盖网络时,将x<sub>i</sub>与{x<sub>l1</sub>,x<sub>l2</sub>,…x<sub>lm</sub>}建立连接,x<sub>i</sub>进一步根据<img file="FDA0001039170200000021.GIF" wi="59" he="64" />中的服务信息,创建一个资源信息的复制消息,并将所述复制消息转发给所有邻居节点x<sub>lm</sub>进行复制,若对等网络中的任一节点接收到一个复制消息时,根据复制消息的编号信息判断是否接收过所述复制消息,若已接收过,丢弃所述复制消息,若首次接收,则根据复制消息的资源信息和节点位置信息,更新<img file="FDA0001039170200000022.GIF" wi="66" he="66" />中的内容,并根据复制消息的生命值,决定转发或丢弃所述复制消息,其中,资源信息需要定期在邻居节点之间进行同步;B、所述资源查找模块具体执行的操作为:设发起查询请求M<sub>j</sub>的节点为x<sub>j</sub>,在x<sub>j</sub>的邻居节点集合中按照概率p<sub>j</sub>随机挑选出的对等节点集为p<sub>j</sub>×{x<sub>j1</sub>,x<sub>j2</sub>,…x<sub>jm</sub>},j∈[1,n];当对等节点x<sub>i</sub>收到x<sub>j</sub>发送的查询请求M<sub>j</sub>时,检查<img file="FDA0001039170200000023.GIF" wi="66" he="64" />和<img file="FDA0001039170200000024.GIF" wi="63" he="64" />中是否含有满足查询请求M<sub>j</sub>的数据资源信息,若是,根据所述数据资源信息和数据资源信息所在对等节点的位置信息,创建查询的响应消息<img file="FDA0001039170200000025.GIF" wi="99" he="71" />并根据x<sub>j</sub>的位置信息,将所述响应信息<img file="FDA0001039170200000026.GIF" wi="83" he="75" />返回给x<sub>j</sub>,然后将x<sub>j</sub>的生命值减1,若x<sub>j</sub>的生命值为0,丢弃查询请求M<sub>j</sub>,若不为0,采用Q学习算法计算p<sub>j</sub>×{x<sub>j1</sub>,x<sub>j2</sub>,…x<sub>jm</sub>}中各对等节点的Q值,将查询请求M<sub>j</sub>转发给p<sub>j</sub>×{x<sub>j1</sub>,x<sub>j2</sub>,…x<sub>jm</sub>}中Q值最大的节点,概率p<sub>j</sub>在网络悠闲时的取值范围为(5,8],在网络拥堵时的取值范围为[0,3);设定Q值的计算公式为:<maths num="0001"><math><![CDATA[<mrow><msub><mi>Q</mi><mrow><mi>n</mi><mi>e</mi><mi>w</mi></mrow></msub><mo>=</mo><msub><mi>Q</mi><mrow><mi>o</mi><mi>l</mi><mi>d</mi></mrow></msub><mo>+</mo><msub><mi>&alpha;Q</mi><mrow><mi>l</mi><mi>e</mi><mi>a</mi><mi>r</mi><mi>n</mi></mrow></msub><mo>+</mo><mi>&beta;</mi><mo>&times;</mo><mi>I</mi><mrow><mo>&lsqb;</mo><mfrac><mrow><msub><mi>N</mi><msub><mi>x</mi><mrow><mi>j</mi><mi>&mu;</mi></mrow></msub></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mrow><mo>(</mo><mrow><msub><mi>T</mi><msub><mi>x</mi><mrow><mi>j</mi><mi>&mu;</mi></mrow></msub></msub><mo>-</mo><msub><msup><mi>T</mi><mo>&prime;</mo></msup><msub><mi>x</mi><mrow><mi>j</mi><mi>&mu;</mi></mrow></msub></msub></mrow><mo>)</mo></mrow></mrow><mrow><msub><msup><mi>T</mi><mo>&prime;</mo></msup><msub><mi>x</mi><mrow><mi>j</mi><mi>&mu;</mi></mrow></msub></msub><mo>&times;</mo><msub><mi>T</mi><msub><mi>x</mi><mrow><mi>j</mi><mi>&mu;</mi></mrow></msub></msub></mrow></mfrac><mo>&rsqb;</mo></mrow><mo>&times;</mo><mfrac><mrow><mn>1</mn><mo>+</mo><msub><mi>N</mi><msub><mi>x</mi><mrow><mi>j</mi><mi>&mu;</mi></mrow></msub></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mrow><msub><mi>T</mi><msub><mi>x</mi><mrow><mi>j</mi><mi>&mu;</mi></mrow></msub></msub></mfrac></mrow>]]></math><img file="FDA0001039170200000027.GIF" wi="1469" he="198" /></maths>其中,Q<sub>new</sub>表示Q的新值,Q<sub>old</sub>表示Q的老值,Q<sub>learn</sub>表示被学习的值,α表示学习速率,β表示拥塞因素,<img file="FDA0001039170200000028.GIF" wi="154" he="71" />表示时刻t节点x<sub>jμ</sub>的缓存队列中待处理的查询请求消息数,<img file="FDA0001039170200000029.GIF" wi="101" he="71" />表示p<sub>j</sub>×{x<sub>j1</sub>,x<sub>j2</sub>,…x<sub>jm</sub>}中的节点x<sub>jμ</sub>处理一条查询请求消息所规定的时间,<img file="FDA00010391702000000210.GIF" wi="84" he="71" />表示p<sub>j</sub>×{x<sub>j1</sub>,x<sub>j2</sub>,…x<sub>jm</sub>}中的节点x<sub>jμ</sub>处理一条查询请求消息实际所需的时间;函数I[x]在x&gt;0时取值为1,x≤0时取值为0,α的取值范围是[0.25,0.3],β的取值范围是[0.45,0.5];(5)任务规划单元:用于对大数据处理过程进行任务规划,将复杂的大数据处理计算任务拆分至一组功能单一且独立的子任务,并为子任务匹配满足其需求的云端服务资源池,形成云服务组合方案,以获得大数据处理过程中所需的存储资源或计算资源;(6)可信组合评估单元:用于根据任务规划单元生成的大数据服务的任务规划,执行云服务组合方案的评估;(7)服务部署单元:用于根据可信组合评估单元选择出的最优的云服务组合方案,自动选择相应大数据分析算法,完成大数据服务的实现和部署。
地址 530000 广西壮族自治区南宁市兴宁区民主路6号