发明名称 |
一种将PDF格式文件转换为EPUB格式的方法及系统 |
摘要 |
本发明公开一种将PDF格式文件转换为EPUB格式的方法,包括:识别PDF格式文件中的文本元素、图像元素;获取所述文本元素的坐标和所述图像元素的坐标;根据所述文本元素的坐标和所述图像元素的坐标,确定所述文本元素和所述图像元素在新生成的HTML格式文件中的位置;按照所述位置,生成HTML格式文件;根据所述HTML格式文件,生成EPUB格式文件。本发明还公开了一种将PDF格式文件转换为EPUB格式的系统。采用本发明所公开的发明或系统,能够使转化成的EPUB格式的文件图文并茂,并保留原PDF格式文件中的文字元素与图像元素的位置关系。 |
申请公布号 |
CN102332002B |
申请公布日期 |
2013.11.13 |
申请号 |
CN201110213555.0 |
申请日期 |
2011.07.28 |
申请人 |
深圳市万兴软件有限公司 |
发明人 |
王峰;晏检平 |
分类号 |
G06F17/30(2006.01)I;G06F17/21(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳市深佳知识产权代理事务所(普通合伙) 44285 |
代理人 |
彭愿洁;李文红 |
主权项 |
一种将PDF格式文件转换为EPUB格式的方法,其特征在于,包括:识别PDF格式文件中的文本元素、图像元素;获取所述文本元素的坐标和所述图像元素的坐标;根据所述文本元素的坐标和所述图像元素的坐标,确定所述文本元素和所述图像元素在新生成的HTML格式文件中的位置,以使新生成的HTML格式文件中的文本元素和图像元素的相对位置关系与PDF格式文件中的文本元素和图像元素的相对位置关系相同;按照确定的位置,生成HTML格式文件;根据所述HTML格式文件,生成EPUB格式文件;其中,所述确定所述文本元素和所述图像元素在新生成的HTML格式文件中的位置,包括:根据所述文本元素的坐标和所述图像元素的坐标,将原本位于所述图像元素左边或上方的所述文本元素,定位在所述图像元素上方;将原本位于所述图像元素右边或下方的所述文本元素,定位在所述图像元素下方。 |
地址 |
518110 广东省深圳市南山区科技园高新南一道TCL大厦A栋8层 |