发明名称 基于用户行为的智能网页分类器
摘要 基于用户行为的智能网页分类器:(1)后台输入初始分类样本集进行训练,获得每个分类在特征空间上的聚类中心。(2)接收用户输入的URL,后台抓取并分析相应的页面,输出页面内有索引价值的文本。并且根据用户输入内容和网页内容,提取特征集合,对初始分类样本集的特征空间进行回馈修改,调整向量空间的特征权重值。(3)采用用户选择的分类器对上一步生成的文本进行自动分类,并输出结果。当用户执行了一次搜索以后,分类器自动判断出每条结果所属的分类,并且对分类器进行逐步调整,用户执行的搜索次数越多,网页分类器的分类就越精确,从而帮助不同用户有效缩小搜索结果的集合,更精准地找到所需的信息。
申请公布号 CN101211339A 申请公布日期 2008.07.02
申请号 CN200610148341.9 申请日期 2006.12.29
申请人 上海芯盛电子科技有限公司 发明人 蔡阳波;陈勇
分类号 G06F17/30(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 上海东方易知识产权事务所 代理人 沈原
主权项 1.一种基于用户行为的智能网页分类器,其特征在于,(1)后台输入初始分类样本集进行训练,获得每个分类在特征空间上的聚类中心;(2)接收用户输入的URL,后台抓取并分析相应的页面,输出页面内有索引价值的文本;并且根据用户输入内容和网页内容,提取特征集合,对初始分类样本集的特征空间进行回馈修改,调整向量空间的特征权重值;(3)采用用户选择的分类器对上一步生成的文本进行自动分类,并输出结果。
地址 201108上海市闵行区金都路4299号