发明名称 |
一种生成结构化数据的元数据的方法与装置 |
摘要 |
本发明的目的是提供一种生成结构化数据的元数据的方法与装置。其中,本发明解析结构化数据,以获得该结构化数据所对应的一个或多个数组,其中每个数组对应于一个数据类型,并确定至少一个数组的数据类型,以根据所确定的数据类型,生成该结构化数据的元数据。本发明提出了一种自动创建结构化数据的元数据的方案,结构化数据的元数据可以供进一步的数据质量检测、数据分析和统计使用等用途。本发明至少具有以下有益效果:第一,可以显著地节省人工成本;第二,本发明所生成的元数据更为准确化、标准化,降低了出错率;第三,元数据自动生成的流程可以与后续的数据分析流程无缝连接,进而提高整体数据处理流程的效率。 |
申请公布号 |
CN104850590A |
申请公布日期 |
2015.08.19 |
申请号 |
CN201510202637.3 |
申请日期 |
2015.04.24 |
申请人 |
百度在线网络技术(北京)有限公司 |
发明人 |
孔亮;王丽敏 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京汉昊知识产权代理事务所(普通合伙) 11370 |
代理人 |
罗朋;赵晶 |
主权项 |
一种生成结构化数据的元数据的方法,其中,该方法包括:a解析结构化数据,以获得所述结构化数据所对应的一个或多个数组,其中每个数组对应于一个数据类型;b确定其中至少一个数组的数据类型;c根据所确定的数据类型,生成所述结构化数据的元数据。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦 |