网页内容的处理方法和装置,申请号CN201610807127.3-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	网页内容的处理方法和装置
摘要	本发明实施例公开了一种网页内容的处理方法和装置。所述方法包括：读取与待处理网页对应的HTML结构正文数据；以段落为单位，对所述HTML结构正文数据进行结构划分，生成段落列表；根据所述段落列表中各段落中具有标题属性的内容，将所述段落列表中的各段落转化为标题文本对。本发明实施例的技术方案在识别出网页正文各段落中包括的标题以及段落正文，并将其整理归纳到一起生成标题文本对后，可以实现使用识别出的标题文本对中的标题来进一步描述网页内容，扩充网页内容的描述信息的技术效果，极大的简化了网页的分析过程，优化了现有的网页内容的处理技术，满足了人们日益增长的个性化、便捷化的网页内容的处理需求。
申请公布号	CN106446072A	申请公布日期	2017.02.22
申请号	CN201610807127.3	申请日期	2016.09.07
申请人	百度在线网络技术（北京）有限公司	发明人	邵睿;徐国强;尹存祥;骆彬;钟辉强;沈剑平
分类号	G06F17/30(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	北京品源专利代理有限公司 11332	代理人	孟金喆;胡彬
主权项	一种网页内容的处理方法，其特征在于，包括：读取与待处理网页对应的超文本标记语言HTML结构正文数据；以段落为单位，对所述HTML结构正文数据进行结构划分，生成段落列表；根据所述段落列表中各段落中具有标题属性的内容，将所述段落列表中的各段落转化为标题文本对。
地址	100085 北京市海淀区上地十街10号百度大厦三层

您可能感兴趣的专利

分步联锁防误操作机房开关装置

连续式水煤气发生炉装置

汽车节油器转子

一种碎边剪切装置

一种自掀盖垃圾箱

自然鼓风悬胆逆燃倍功灶用多功炉

门窗锁装置

自行车摩电灯

新型轻烃液体燃料气化罐

车库翻板门

Anordning för att tillhandahålla kylda eller frysta varor

POLYMERIC AMINE STABILIZER FOR SPANDEX

METHOD FOR MANUFACTURING STORAGE NODE FOR SEMICONDUCTOR MEMORY DEVICE

APPARATUS FOR MANUFACTURING SEA-ISLAND CONJUGATED YARN

Antiherpes peptidomimetic compounds

SEMICONDUCTOR DEVICE

Puristusvaippa paperirainan kuivaamiseksi

ATM PHYSICAL LAYER PARALLEL AUTO-SYNCHRONIZING DESCRAMBLER BASED ON SYNCHRONOUS DIGITAL HIERARCHY