发明名称 分析、转换和拆分结构化数据的方法和装置
摘要 本发明提供了一种分析结构化数据的方法和装置、转换结构化数据的方法和装置以及拆分结构化数据的方法和装置。该分析结构化数据的方法包括:利用预先定义的与上述结构化数据相对应的模式信息,对上述结构化数据进行分析和验证;其中,上述模式信息包括利用正则表达式表示的与该结构化数据的结构和验证有关的信息。在本发明中,通过利用正则表达式预先构建与诸如EDI文档的结构化数据的结构和验证有关的模式信息,而在分析过程中直接利用该模式信息获取该结构化数据的结构信息并对该结构化数据进行验证,从而能够解除分析方法和装置对于结构化数据的特定结构的依赖性。
申请公布号 CN101520770B 申请公布日期 2011.05.04
申请号 CN200810080925.6 申请日期 2008.02.29
申请人 国际商业机器公司 发明人 李晓凯;尹宏斌
分类号 G06F17/22(2006.01)I 主分类号 G06F17/22(2006.01)I
代理机构 北京市中咨律师事务所 11247 代理人 李峥;于静
主权项 一种分析结构化数据(structural data)的方法,其特征在于,包括:利用预先定义的与上述结构化数据相对应的模式信息(schema information),对上述结构化数据进行分析和验证,其中,上述模式信息包括利用正则表达式(regular expression)表示的与该结构化数据的结构和验证有关的信息,其中上述利用预先定义的与上述结构化数据相对应的模式信息,对上述结构化数据进行分析和验证的步骤进一步包括:对上述模式信息进行分析,以解析出其中与上述结构化数据的结构和验证有关的信息;根据上述与结构化数据的结构和验证有关的信息,将上述结构化数据中的各元素与上述模式信息中的相应正则表达式进行匹配,以验证该结构化数据。
地址 美国纽约