发明名称 文档格式转化系统及方法
摘要 本发明揭示了一种文档格式转化系统及方法,该文档格式转化系统包括图片转化模块、文字获取模块、文字图像映射模块;图片转化模块用以把文档的每一页转为图片格式的数据;文字获取模块用以获取文档每一页的文字、各文字在图片中的状态信息;文字图像映射模块用以生成各页文字信息与图片所对应的映射表,该表中包含有各文字在图片中的状态信息。本发明可避免出现因未安装网页插件而不能阅读文档的问题。
申请公布号 CN101699426B 申请公布日期 2012.02.29
申请号 CN200910198421.9 申请日期 2009.11.06
申请人 上海传知信息科技发展有限公司 发明人 陆昀
分类号 G06F17/21(2006.01)I;G06F17/22(2006.01)I;G06F17/30(2006.01)I;G06T11/60(2006.01)I 主分类号 G06F17/21(2006.01)I
代理机构 上海光华专利事务所 31219 代理人 余明伟;尹丽云
主权项 一种文档格式转化系统,其特征在于,该系统包括:图片转化模块,用以把文档的每一页转为图片格式的数据;文字获取模块,用以获取文档每一页的文字、各文字在图片中的状态信息;文字图像映射模块,用以生成各页文字信息与图片所对应的映射表,该表中包含有各文字在图片中的状态信息;所述图片转化模块、文字获取模块把每一个文档的每一页转换为一张无损图片文件和一个包含该页所有文字信息的文本文件,图片文件用于在网页上显示,文本文件用于文档的全文搜索;为了能够提取在图片选择区域中的文字,在转换时,所述文字图像映射模块生成一张文字图像映射表,该表中确定了所有文字在图片中的状态;所述文字在图片中的状态信息包括文字的位置、旋转状态数据、扭曲状态数据、缩放状态数据;所述系统进一步包括PPT‑FLASH转换模块,用以将PPT格式的数据转换为FLASH格式,其包括:PPT分析器,用以分析PPT文档的结构,把PPT文档中的对象分为PPT对象、资源对象;所述PPT对象包括PPT对象的形状、文本、效果,所述资源对象包括图片、音乐、视频、FLASH文件;FLASH生成器,用以把PPT对象的形状、文本、效果对应生成与FLASH一致的形状、文本、效果,同时把PPT中的图片、音乐、视频、FLASH文件嵌入或载入FLASH文档中;所述FLASH生成器包括:形状生成单元,用以根据所述PPT分析器获取的PPT文件中每个形状的大小、几何形状、矩形轮廓框和位置,利用这些信息生成与Flash一致的形状;文本生成单元,用以根据所述PPT分析器获取的PPT文件中的文本大小、定位、样式、字体和位置,利用这些信息生成与Flash一致的文本;效果生成单元,用以根据所述PPT分析器获取的PPT文件中的动画效果类别、动画效果参数,利用这些信息生成包含ActionScript脚本的Flash 一致的动画效果;图片生成单元,用以根据所述PPT分析器解析出的图片尺寸、定位、位置,将图片数据进行压缩优化后直接生成与Flash一致的图片;音乐生成单元,用以根据所述PPT分析器解析出的PPT文件中的音频对象,将音频数据进行压缩优化后直接嵌入到Flash文档;视频生成单元,用以根据所述PPT分析器解析出的PPT文件中的视频对象,将视频数据转换成flv视频格式,利用Flash课件播放器进行播放视频;FLASH生成单元,用以根据所述PPT分析器解析出的PPT文件中的Flash对象,直接将Flash对象生成单独的Flash文件,利用Flash课件播放器直接载入Flash文档。
地址 200435 上海市宝山区共和新路5199号5楼E室