发明名称 一种网页内容的格式化输出方法
摘要 本发明公开了一种网页内容的格式化输出方法,其特征在于,将网页特定区域的内容格式化输出成纯文本格式,并在适当的地方加上缩进和回车等,使输出的文本尽可能接近浏览器里的展示形式,该方法包括:解析Html页面,将html转换成标准xml格式;先有预留一个字符串缓冲区(StringBuffer),生成文档树结构(DOMTree)并遍历该树结构的所有节点,将文本内容追加到字符串缓冲区中。遍历完成后字符串缓冲区的内容就是最终的格式化文本。本发明提供的网页内容输出方法,使得对网页的正文以更接近浏览器似的格式化输出,给用户更好的阅读体验。
申请公布号 CN103116592A 申请公布日期 2013.05.22
申请号 CN201210009117.7 申请日期 2012.01.13
申请人 昆山麦克斯泰科技有限公司 发明人 黄靖
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种网页内容的格式化输出方法,其特征在于,该方法包括以下步骤:A、解析Html页面,将html转换成标准xml格式;B、先有预留一个字符串缓冲区(StringBuffer),生成文档树结构(DOMTree)并遍历该树结构的所有节点,将文本内容追加到字符串缓冲区中,遍历完成后字符串缓冲区的内容就是最终的格式化文本。
地址 215300 江苏省昆山市开发区伟业路18号现代广场A座608室