发明名称 网页微内容提取、聚合和自动更新系统的方法
摘要 本发明涉及一种网页微内容提取、聚合和自动更新系统的方法。本发明提供一种有效地根据网页内容的功能来分区网页微内容,并将网页微内容提取、聚合和自动更新,动态生成用户个性化的页面,其中的微内容将随原网页的更新而更新。本发明的方法是先在用户端输入网页的地址,将合法的内容传递到服务器端的网页微内容分析子系统,然后按超链接群标记不同的微内容板块或栏目,将标记的html文本内容传回到用户端,选中原始微内容或其父辈节点,添加到用户端微内容桌面子系统,完成页面的布置。本发明利用网络微信息提取和聚合方法,用户可以在桌面上进行搜索,方便的引进第三方的服务,整合用户需要的网上信息。
申请公布号 CN1959679A 申请公布日期 2007.05.09
申请号 CN200610152708.4 申请日期 2006.09.25
申请人 北京爱笛星科技有限公司 发明人 徐凯;王亮
分类号 G06F17/30(2006.01);H04L29/06(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 代理人
主权项 1、本发明基于网页微内容提取、聚合和自动更新系统的方法,其特征是包括下述步骤:①、用户端输入网页的地址,向后台服务器端发出访问请求,由服务器端的网页抓取子系统(1)通过http协议下载网页的html内容,检查数据的完整性和语法的合法性,将合法的内容传递到服务器端的网页微内容分析子系统(2);②、服务器端的网页微内容分析子系统(2)解析html文本数据,然后按超链接群标记不同的微内容板块或栏目,以及原始微内容的父辈节点,然后将标记的html文本内容传回到用户端;③、服务器端的微内容选择子系统(3),分析内容中的标记并联系对应的鼠标事件,用户通过鼠标左右键的操作,选中原始微内容或其父辈节点,并可以多选,添加到用户端微内容桌面子系统(4);此时当系统给出一个取消指令,系统返回步骤①;否则继续进行步骤④;④、用户端微内容桌面子系统(4)提供多页面、多栏目和自由排版等编辑功能,使用户使用简单的鼠标点击和拖拽到相关对应项目,完成页面的布置;⑤、服务器端的微内容比较子系统(6)应用抓取子系统定时更新用户定制的信息,比较两个时点的网页内容,并过滤出更新的内容以备用户端微内容桌面子系统(4)的查询及提醒服务的需求。
地址 100039北京市海淀区永定路88号长银大厦16B08室