发明名称 一种生成结构化数据的元数据的方法与装置
摘要 本发明的目的是提供一种生成结构化数据的元数据的方法与装置。其中,本发明解析结构化数据,以获得该结构化数据所对应的一个或多个数组,其中每个数组对应于一个数据类型,并确定至少一个数组的数据类型,以根据所确定的数据类型,生成该结构化数据的元数据。本发明提出了一种自动创建结构化数据的元数据的方案,结构化数据的元数据可以供进一步的数据质量检测、数据分析和统计使用等用途。本发明至少具有以下有益效果:第一,可以显著地节省人工成本;第二,本发明所生成的元数据更为准确化、标准化,降低了出错率;第三,元数据自动生成的流程可以与后续的数据分析流程无缝连接,进而提高整体数据处理流程的效率。
申请公布号 CN104850590A 申请公布日期 2015.08.19
申请号 CN201510202637.3 申请日期 2015.04.24
申请人 百度在线网络技术(北京)有限公司 发明人 孔亮;王丽敏
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京汉昊知识产权代理事务所(普通合伙) 11370 代理人 罗朋;赵晶
主权项 一种生成结构化数据的元数据的方法,其中,该方法包括:a解析结构化数据,以获得所述结构化数据所对应的一个或多个数组,其中每个数组对应于一个数据类型;b确定其中至少一个数组的数据类型;c根据所确定的数据类型,生成所述结构化数据的元数据。
地址 100085 北京市海淀区上地十街10号百度大厦