发明名称 一种以XML为基础的Web数据挖掘系统
摘要 本发明公开了一种以XML为基础的Web数据挖掘系统,该系统包括用户界面模块、预处理模块、数据挖掘模块、结果评估模块;本发明有效解决了面向Web的数据挖掘难题,XML使来源不同的结构化数据进行了有效结合,为多样化难兼容数据库的搜索带来了可能,有效解决了Web数据挖掘技术性难题。此外,XML强大的扩展性与灵活性,允许XML对各种应用软件数据进行合理描述,便于对所搜集到的Web数据记录进行描述,因而为软件开发人员、Web终端及站点使用人员提供了有利的条件。
申请公布号 CN106446238A 申请公布日期 2017.02.22
申请号 CN201610885629.8 申请日期 2016.10.10
申请人 合肥红珊瑚软件服务有限公司 发明人 曹卫星
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京和信华成知识产权代理事务所(普通合伙) 11390 代理人 胡剑辉
主权项 一种以XML为基础的Web数据挖掘系统,其特征在于,包括用户界面模块、预处理模块、数据挖掘模块、结果评估模块;所述的户界面模块为用户与系统之间的交互提供了接口,用户可先对挖掘参数进行设置,在提交挖掘请求,并根据结果进行评估;所述的预处理模块负责对网页数据构建半结构化模型,并将其特征元数据进行抽取,利用结构化形式予以保存,构建以Web为基础的多层数据库,体现文档集合的特点;所述的数据挖掘模块包括挖掘器单元和方法驱动单元;所述的挖掘器单元负责以相关要求为依据,对挖掘方法进行选择,以更好地执行数据挖掘任务;所述的方法驱动单元利用所挖掘的信息,对Web页面内容进行修订,改进服务设计等,为用户提供个性化的界面和服务;所述的结果评估模块负责对结果进行评价,并为用户推荐其可能感兴趣的网页。
地址 232000 安徽省合肥市高新区科学大道79号科园创业中心2号楼606室