发明名称 一种将PDF格式文件转换为EPUB格式的方法及系统
摘要 本发明公开一种将PDF格式文件转换为EPUB格式的方法,包括:识别PDF格式文件中的文本元素、图像元素;获取所述文本元素的坐标和所述图像元素的坐标;根据所述文本元素的坐标和所述图像元素的坐标,确定所述文本元素和所述图像元素在新生成的HTML格式文件中的位置;按照所述位置,生成HTML格式文件;根据所述HTML格式文件,生成EPUB格式文件。本发明还公开了一种将PDF格式文件转换为EPUB格式的系统。采用本发明所公开的发明或系统,能够使转化成的EPUB格式的文件图文并茂,并保留原PDF格式文件中的文字元素与图像元素的位置关系。
申请公布号 CN102332002B 申请公布日期 2013.11.13
申请号 CN201110213555.0 申请日期 2011.07.28
申请人 深圳市万兴软件有限公司 发明人 王峰;晏检平
分类号 G06F17/30(2006.01)I;G06F17/21(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人 彭愿洁;李文红
主权项 一种将PDF格式文件转换为EPUB格式的方法,其特征在于,包括:识别PDF格式文件中的文本元素、图像元素;获取所述文本元素的坐标和所述图像元素的坐标;根据所述文本元素的坐标和所述图像元素的坐标,确定所述文本元素和所述图像元素在新生成的HTML格式文件中的位置,以使新生成的HTML格式文件中的文本元素和图像元素的相对位置关系与PDF格式文件中的文本元素和图像元素的相对位置关系相同;按照确定的位置,生成HTML格式文件;根据所述HTML格式文件,生成EPUB格式文件;其中,所述确定所述文本元素和所述图像元素在新生成的HTML格式文件中的位置,包括:根据所述文本元素的坐标和所述图像元素的坐标,将原本位于所述图像元素左边或上方的所述文本元素,定位在所述图像元素上方;将原本位于所述图像元素右边或下方的所述文本元素,定位在所述图像元素下方。
地址 518110 广东省深圳市南山区科技园高新南一道TCL大厦A栋8层