发明名称 一种数据包稀缺性评估方法及其系统
摘要 本发明提供一种数据包稀缺性评估方法及其系统,该方法包括以下步骤:S100:获取与指定内容相关的多个相关数据包;S200:确定待评估数据包,并确定待评估数据包与其他数据包之间的相似度,选取与待评估数据包之间的相似度高于预定阈值的数据包作为比较数据包;S300:利用预设处理方法来确定待评估数据包的稀缺性。本发明通过对数据包的稀缺性进行评估,从而能够清楚数据包的质量,为数据的价值评估提供一定的参考依据。
申请公布号 CN106503228A 申请公布日期 2017.03.15
申请号 CN201610970543.5 申请日期 2016.10.28
申请人 国信优易数据有限公司 发明人 张斌德;王军;孙玉权
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京青松知识产权代理事务所(特殊普通合伙) 11384 代理人 郑青松
主权项 一种数据包稀缺性评估方法,其特征在于,包括:S100:获取与指定内容相关的多个相关数据包;S200:确定待评估数据包,并确定待评估数据包与其他数据包之间的相似度,选取与待评估数据包之间的相似度高于预定阈值的数据包作为比较数据包;S300:利用预设处理方法来确定待评估数据包的稀缺性,具体通过如下公式评估待评估数据包的稀缺性:<maths num="0001"><math><![CDATA[<mrow><mi>f</mi><mo>=</mo><mfrac><mrow><mn>2</mn><msup><mi>e</mi><mrow><mo>-</mo><mi>y</mi><mo>/</mo><mi>x</mi></mrow></msup></mrow><mrow><mn>1</mn><mo>+</mo><msup><mi>e</mi><mrow><mo>-</mo><mi>y</mi><mo>/</mo><mi>x</mi></mrow></msup></mrow></mfrac></mrow>]]></math><img file="FDA0001144013470000011.GIF" wi="252" he="175" /></maths>其中,f为待评估数据包的稀缺性得分,取值范围为[0,1];y为除待评估数据包以外的其他数据包中所有数据条数之和;x为待评估数据包中的数据条数。
地址 100070 北京市丰台区南四环西路188号总部公馆(ABP)B座9楼