发明名称 |
解析标记语言文档的方法和解析器 |
摘要 |
本发明提供了一种解析标记语言文档的解析方法和解析器。该解析方法包括以下步骤:将该标记语言文档的主体预分割为多个部分;扫描所述多个部分中的每个部分,其中当扫描每个部分时,仅在发现特定标记的情况下才停止对该部分的扫描,并且记录停止扫描的停止点;利用各个停止点将标记语言文档的主体分割为多个片段;并行地解析所述多个片段,并且产生对各个片段的解析结果;以及组合对各个片段的解析结果,形成对该标记语言文档的解析结果。还提出了一种支持名称空间的解析方法。所述解析方法和解析器通过利用多个处理器单元并行地解析单个文档而加快了解析标记语言文档的速度,并且还能够提供对名称空间的良好支持。 |
申请公布号 |
CN101329665A |
申请公布日期 |
2008.12.24 |
申请号 |
CN200710110184.7 |
申请日期 |
2007.06.18 |
申请人 |
国际商业机器公司 |
发明人 |
梁志勇;党亚斌;戈弋;邵凌;徐洋 |
分类号 |
G06F17/27(2006.01);G06F17/30(2006.01) |
主分类号 |
G06F17/27(2006.01) |
代理机构 |
北京市柳沈律师事务所 |
代理人 |
黄小临;王志森 |
主权项 |
1.一种解析标记语言文档的方法,包括:预分割步骤,将该标记语言文档的主体预分割为多个部分;扫描步骤,扫描所述多个部分中的每个部分,其中当扫描每个部分时,仅在发现特定标记的情况下才停止对该部分的扫描,并且记录停止扫描的停止点;分割步骤,利用各个停止点将标记语言文档的主体分割为多个片段;解析步骤,并行地解析所述多个片段,并且产生对各个片段的解析结果;以及组合步骤,组合对各个片段的解析结果,从而形成对该标记语言文档的解析结果。 |
地址 |
美国纽约阿芒克 |