发明名称 |
基于数据质量的主题数据集多层分面过滤方法与系统 |
摘要 |
本发明提供一种基于数据质量的主题数据集多层分面过滤方法与系统,该方法包括以下步骤:根据数据目录中数据集质量元数据构建并存储一个数据质量分面分类层次;根据数据质量分面分类层次和用户搜索数据目录所产生的主题数据集物化出一个特定主题的数据质量分面分类层次,并将其树形结构在人机交互界面中进行可视化;根据用户在上述树形结构中选择的数据质量分面对主题数据集进行基于数据质量的过滤,并按用户选定的方式对过滤结果进行排序;在人机交互界面中输出过滤并排序后的主题数据集信息。本发明克服了现有主题数据集过滤技术忽视数据质量的弊端,用多层分面过滤来方便用户筛选符合数据质量要求的主题数据集,代表数据目录门户技术发展趋势。 |
申请公布号 |
CN106354799A |
申请公布日期 |
2017.01.25 |
申请号 |
CN201610738482.X |
申请日期 |
2016.08.26 |
申请人 |
河海大学 |
发明人 |
许卓明;夏文泽 |
分类号 |
G06F17/30(2006.01)I;G06Q30/06(2012.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
南京苏高专利商标事务所(普通合伙) 32204 |
代理人 |
肖明芳 |
主权项 |
一种基于数据质量的主题数据集多层分面过滤方法,包括下列步骤:S1:根据数据目录中数据集质量元数据构建并存储一个数据质量分面分类层次;S2:根据数据质量分面分类层次和用户搜索数据目录所产生的主题数据集物化出一个特定主题的数据质量分面分类层次,并将其树形结构在人机交互界面中进行可视化;S3:根据用户在上述树形结构中选择的数据质量分面对主题数据集进行基于数据质量的过滤,并按用户选定的方式对过滤结果进行排序;S4:在人机交互界面中输出过滤并排序后的主题数据集信息。 |
地址 |
211100 江苏省南京市江宁开发区佛城西路8号 |