发明名称 多线程环境下并行XSLT转换方法和装置
摘要 随着XML文档的规模越来越大,结构越来越复杂,XSLT的转换性能问题则成了限制其继续发展的一个重要问题。本发明提供的并行XSLT转换方法及装置通过将XSLT文件划分为多个转换模块,利用多线程环境来进行并行XSLT转换来提高转换效率。本发明通过对XSLT文件本身以及各转换模块对训练数据的转换情况的分析,可以实现XSLT文件的自动化并行划分,避免了人工划分的不足;并且,划分得到的各个转换模块数量优化、转换代价均衡,可以在多线程环境下有效地提高对源文档进行XSLT转换的性能和效率。
申请公布号 CN102622334B 申请公布日期 2014.04.16
申请号 CN201210119271.X 申请日期 2012.04.20
申请人 北京信息科技大学;李宁 发明人 高晓光;侯霞;李宁
分类号 G06F17/22(2006.01)I 主分类号 G06F17/22(2006.01)I
代理机构 北京远大卓悦知识产权代理事务所(普通合伙) 11369 代理人 贺持缓
主权项 一种多线程环境下并行XSLT转换的方法,该方法将XML源文档通过并行XSLT转换成目标文档,其特征在于,该方法包括步骤: 自动划分步骤,其将XSLT文件自动地划分为多个能够并行运算的并行转换模块; 并行转换步骤,其利用所述并行转换模块分别对待转换的XML源文档同时进行XSLT转换,并得到多个中间转换结果; 转换结果合并步骤,其将所述多个中间转换结果进行有序合并,并输出最终的转换后的目标文档; 其中,所述自动划分步骤具体包括: 初始化步骤,其将转换模块集合初始化为整个所述XSLT文件对应的转换模块; 代价评估步骤,其评估转换模块集合中各个转换模块的转换代价,如果各个转换模块的转换代价均衡,则执行结果输出步骤,否则执行合并与再分步骤;所述转换代价用转换模块转换训练数据的时间消耗来衡量; 合并与再分步骤,其将转换代价高的转换模块再次划分,而将转换代价低的转换模块进行合并; 更新步骤,其更新当前的转换模块集合,将其中再次划分前的转换模块替换为划分后的多个转换模块,并将其中合并前的转换模块替换为合并后的转换模块,然后重新执行代价评估步骤; 结果输出步骤,其输出转换模块集合中的各个转换模块作为所述并行转换模块。 
地址 100092 北京市海淀区清河小营东路12号166信箱