发明名称 一种解析Word文件信息的方法及其系统
摘要 本发明公开了一种解析Word文件信息的方法及其系统,该方法包括:将待解析的Word文件转换为Word_XML2003格式文档的中间文件;解析Word_XML2003格式文档中元素的基本信息,并将解析得到的信息按照Word的规则进行组合;将解析组合后的对象写入XML文件。由于采用了Word_XML2003格式文档作为中间文件,并在解析Word_XML2003格式文档后按照Word的规则进行组合,不仅在解析比较复杂的元素时不会造成属性丢失,而且还避免了频繁的调用Com接口,节约了系统资源,高效稳定地解析了所有格式的Word文件信息,特别适合满足需要批量解析各种版本的Word文件信息的情况下使用。
申请公布号 CN101980183A 申请公布日期 2011.02.23
申请号 CN201010285333.5 申请日期 2010.09.17
申请人 深圳市万兴软件有限公司 发明人 解辉
分类号 G06F17/21(2006.01)I 主分类号 G06F17/21(2006.01)I
代理机构 深圳市君胜知识产权代理事务所 44268 代理人 刘文求;韩金明
主权项 一种解析Word文件信息的方法,其特征在于,包括以下步骤:将待解析的Word文件转换为Word_XML2003格式文档的中间文件;解析Word_XML2003格式文档中元素的基本信息,并将解析得到的信息按照Word的规则进行组合;将解析组合后的对象写入XML文件。
地址 518057 广东省深圳市南山区高新南一道TCL大厦A座901