发明名称 |
一种解析Word文件信息的方法及其系统 |
摘要 |
本发明公开了一种解析Word文件信息的方法及其系统,该方法包括:将待解析的Word文件转换为Word_XML2003格式文档的中间文件;解析Word_XML2003格式文档中元素的基本信息,并将解析得到的信息按照Word的规则进行组合;将解析组合后的对象写入XML文件。由于采用了Word_XML2003格式文档作为中间文件,并在解析Word_XML2003格式文档后按照Word的规则进行组合,不仅在解析比较复杂的元素时不会造成属性丢失,而且还避免了频繁的调用Com接口,节约了系统资源,高效稳定地解析了所有格式的Word文件信息,特别适合满足需要批量解析各种版本的Word文件信息的情况下使用。 |
申请公布号 |
CN101980183A |
申请公布日期 |
2011.02.23 |
申请号 |
CN201010285333.5 |
申请日期 |
2010.09.17 |
申请人 |
深圳市万兴软件有限公司 |
发明人 |
解辉 |
分类号 |
G06F17/21(2006.01)I |
主分类号 |
G06F17/21(2006.01)I |
代理机构 |
深圳市君胜知识产权代理事务所 44268 |
代理人 |
刘文求;韩金明 |
主权项 |
一种解析Word文件信息的方法,其特征在于,包括以下步骤:将待解析的Word文件转换为Word_XML2003格式文档的中间文件;解析Word_XML2003格式文档中元素的基本信息,并将解析得到的信息按照Word的规则进行组合;将解析组合后的对象写入XML文件。 |
地址 |
518057 广东省深圳市南山区高新南一道TCL大厦A座901 |