发明名称 基于可信云计算的信息大数据分析支撑方法
摘要 本发明公开了基于可信云计算的信息大数据分析支撑方法,该方法是在具有保护性功能、认证和完整性度量等特征基础上构建一种可信度评估机制和可信关系传递机制,通过关键词和标记的运用,预先将数据库划分为多个子数据库,检索时先在相关度高的子数据库中进行检索,减少了计算量,提高了运算速度;基于单词包表示图像时,提出了加权表示和第一视觉相似度,减少了时间开销;基于特征组合表示图像时,利用了局部特征之间的空间包含关系,提出将相关的局部特征组合在一起以增强其视觉表达能力;该特征组合不但具有良好的尺度和旋转不变性,而且还能够自然地利用各特征元素之间的相对位置信息进行局部几何校验,剔除可能存在的错误匹配,以提高图像检索的准确率;特征量化以及组合表达大幅地提高了检索的精度。
申请公布号 CN106203165A 申请公布日期 2016.12.07
申请号 CN201610525169.8 申请日期 2016.07.01
申请人 何钟柱 发明人 陈祖斌;谢铭;胡继军;翁小云;袁勇;邓戈锋;莫英红;谢菁;张鹏;唐玲丽;黄连月;杭聪;贺冠博;苏宇琦;宋骏豪
分类号 G06F21/62(2013.01)I;G06F17/30(2006.01)I;G06F21/57(2013.01)I 主分类号 G06F21/62(2013.01)I
代理机构 北京高航知识产权代理有限公司 11530 代理人 吴强
主权项 基于可信云计算的信息大数据分析支撑方法,其特征是,包括以下步骤:(1)由云服务器获取信息数据,认证所需进行信息收集的网络中的硬件节点,判断网络硬件节点可信度,建立所采集信息的信任关系,将图像信息和非图像信息进行分类后,分别储存到图像数据库和非图像数据库中,并将来源相同的图像信息和非图像信息作标记;(2)将非图像数据库按照预先设定的多个关键词划分为多个第一子数据库,同时按照所述关键词对非图像信息进行分类,分别储存到对应的所述第一子数据库中,未匹配到关键词的非图像信息单独划分为一类;(3)将图像数据库按照所述关键词划分为多个第二子数据库,并对图像信息根据与其来源相同的非图像信息进行分类,分别储存到对应所述第二子数据库中,无来源相同标记的图像信息,或者其对应的非图像信息未匹配到关键词的图像信息单独划分为一类;(4)当用户输入关键词进行检索时,按照输入的关键词与预先设定的关键词的相关度排序依次在各个第一字数据库和第二子数据库中分别进行检索,并分别输出图像数据和非图像数据的检索结果;每个第二子数据库的图像检索中还提供了通过输入查询图像I<sub>p</sub>来检索相似图像的功能,该功能由以下步骤实现:(1‑1)采用SIFT特征对图像局部区域进行可信描述;(1‐2)基于单词包的图像可信表示:a.采用基于单词包模型对局部特征进行量化,设由M个局部特征向量组成的样本空间X={x<sub>1</sub>,…,x<sub>M</sub>},以无监督方式快速聚类生成初始视觉码本,采用最近邻策略建立局部特征x<sub>j</sub>与相对应的视觉单词的映射关系,j=1,…,M;b.设码本空间中包含N个视觉单词,则任一图像表示为高维稀疏向量{w<sub>1</sub>,…,w<sub>N</sub>},w<sub>i</sub>表示视觉单词i的权值,i=1,…,N;<maths num="0001"><math><![CDATA[<mrow><msub><mi>w</mi><mi>i</mi></msub><mo>=</mo><mfrac><msubsup><mi>t</mi><mi>i</mi><mi>p</mi></msubsup><mrow><msub><mi>t</mi><mi>i</mi></msub><mo>-</mo><msubsup><mi>t</mi><mi>i</mi><mi>p</mi></msubsup></mrow></mfrac><mo>&times;</mo><mfrac><mn>1</mn><msub><mi>f</mi><mi>i</mi></msub></mfrac></mrow>]]></math><img file="FDA0001039183400000011.GIF" wi="358" he="151" /></maths>式中,<img file="FDA0001039183400000012.GIF" wi="47" he="71" />表示该图像中视觉单词i出现的次数,t<sub>i</sub>表示图像数据库中视觉单词i出现的总次数,f<sub>i</sub>表示图像数据库中包含视觉单词i的图像数目;对权值w<sub>i</sub>进行归一化处理,令<img file="FDA0001039183400000013.GIF" wi="208" he="95" />∑<sub>i</sub>δ<sub>i</sub>=1,此时任一图像的高维稀疏向量表示为{δ<sub>1</sub>,…,δ<sub>N</sub>};c.对于任意两幅图像p和q,定义两幅图像之间的第一视觉相似度S(p,q):<maths num="0002"><math><![CDATA[<mrow><mi>S</mi><mrow><mo>(</mo><mrow><mi>p</mi><mo>,</mo><mi>q</mi></mrow><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><msqrt><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></msubsup><msup><mrow><mo>(</mo><mrow><mfrac><mrow><mfrac><msubsup><mi>t</mi><mi>i</mi><mi>p</mi></msubsup><mrow><msub><mi>t</mi><mi>i</mi></msub><mo>-</mo><msubsup><mi>t</mi><mi>i</mi><mi>p</mi></msubsup></mrow></mfrac><mo>&times;</mo><mfrac><mn>1</mn><msub><mi>f</mi><mi>i</mi></msub></mfrac></mrow><mrow><msub><mi>&Sigma;</mi><mi>i</mi></msub><mfrac><msubsup><mi>t</mi><mi>i</mi><mi>p</mi></msubsup><mrow><msub><mi>t</mi><mi>i</mi></msub><mo>-</mo><msubsup><mi>t</mi><mi>i</mi><mi>p</mi></msubsup></mrow></mfrac><mo>&times;</mo><mfrac><mn>1</mn><msub><mi>f</mi><mi>i</mi></msub></mfrac></mrow></mfrac><mo>-</mo><mfrac><mrow><mfrac><msubsup><mi>t</mi><mi>i</mi><mi>q</mi></msubsup><mrow><msub><mi>t</mi><mi>i</mi></msub><mo>-</mo><msubsup><mi>t</mi><mi>i</mi><mi>q</mi></msubsup></mrow></mfrac><mo>&times;</mo><mfrac><mn>1</mn><msub><mi>f</mi><mi>i</mi></msub></mfrac></mrow><mrow><msub><mi>&Sigma;</mi><mi>i</mi></msub><mfrac><msubsup><mi>t</mi><mi>i</mi><mi>q</mi></msubsup><mrow><msub><mi>t</mi><mi>i</mi></msub><mo>-</mo><msubsup><mi>t</mi><mi>i</mi><mi>q</mi></msubsup></mrow></mfrac><mo>&times;</mo><mfrac><mn>1</mn><msub><mi>f</mi><mi>i</mi></msub></mfrac></mrow></mfrac></mrow><mo>)</mo></mrow><mn>2</mn></msup></mrow></msqrt></mfrac></mrow>]]></math><img file="FDA0001039183400000021.GIF" wi="1094" he="375" /></maths>S(p,q)越大,表明两幅图像越接近;(5)对计算结果进行可信评估。
地址 530000 广西壮族自治区南宁市兴宁区民主路6号