发明名称 | 基于用户行为的智能网页分类器 | ||
摘要 | 基于用户行为的智能网页分类器:(1)后台输入初始分类样本集进行训练,获得每个分类在特征空间上的聚类中心。(2)接收用户输入的URL,后台抓取并分析相应的页面,输出页面内有索引价值的文本。并且根据用户输入内容和网页内容,提取特征集合,对初始分类样本集的特征空间进行回馈修改,调整向量空间的特征权重值。(3)采用用户选择的分类器对上一步生成的文本进行自动分类,并输出结果。当用户执行了一次搜索以后,分类器自动判断出每条结果所属的分类,并且对分类器进行逐步调整,用户执行的搜索次数越多,网页分类器的分类就越精确,从而帮助不同用户有效缩小搜索结果的集合,更精准地找到所需的信息。 | ||
申请公布号 | CN101211339A | 申请公布日期 | 2008.07.02 |
申请号 | CN200610148341.9 | 申请日期 | 2006.12.29 |
申请人 | 上海芯盛电子科技有限公司 | 发明人 | 蔡阳波;陈勇 |
分类号 | G06F17/30(2006.01) | 主分类号 | G06F17/30(2006.01) |
代理机构 | 上海东方易知识产权事务所 | 代理人 | 沈原 |
主权项 | 1.一种基于用户行为的智能网页分类器,其特征在于,(1)后台输入初始分类样本集进行训练,获得每个分类在特征空间上的聚类中心;(2)接收用户输入的URL,后台抓取并分析相应的页面,输出页面内有索引价值的文本;并且根据用户输入内容和网页内容,提取特征集合,对初始分类样本集的特征空间进行回馈修改,调整向量空间的特征权重值;(3)采用用户选择的分类器对上一步生成的文本进行自动分类,并输出结果。 | ||
地址 | 201108上海市闵行区金都路4299号 |