发明名称 一种通用型互联网信息数据挖掘方法
摘要 本发明通过直接向数据挖掘需求用户提供通用型互联网信息数据挖掘需求描述人机交互模板,对海量互联网数据提供了一组既开放又有严格定义的概念集合、数据结构、挖掘数据操作的完整性约束条件,满足了建立数据挖掘模型的三要素,为提供互联网挖掘服务的价值密度提供了重要条件,可以实现互联网结构化数据、半结构化数据、非结构化数据的通用和并行挖掘。
申请公布号 CN103970848B 申请公布日期 2016.05.11
申请号 CN201410180219.4 申请日期 2014.05.01
申请人 刘莎 发明人 刘莎
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种通用型互联网信息数据挖掘方法,其特征在于,包括以下步骤:输出数据挖掘人机交互模板,从数据挖掘人机交互模板中的挖掘需求关键词输入模板中获得数据挖掘中的主题关键词、语用关键词、语用关键词项下的普通关键词,从数据挖掘人机交互模板中的相关挖掘需求选择栏中获得用户选择的相关需求,以及直接输入的特殊需求,获得数据挖掘操作指令,并根据获得的数据挖掘需求关键词以及获得的用户选择的挖掘需求,对互联网信息进行数据挖掘操作,将数据挖掘结果输出给相关需求方;其中,所述的数据挖掘人机交互模板中预设有挖掘需求关键词输入模板、相关挖掘需求选择项,以及挖掘需求自由输入框;其中,所述的挖掘需求关键词输入模板中预设内容的产生方法与互联网信息通用摘要数据库结构标签的产生方法一致,其中,所述的互联网信息通用摘要数据库结构标签的产生方法是指,统计互联网信息任意主题关键词的常用顶层及下层摘要结构标签及分类集成结果,自动生成包括详细信息链接地址的互联网信息通用摘要数据库结构标签和信息发布通用模板,并在信息发布通用模板上获得由用户自主添加的适用于互联网信息任意主题关键词的顶层及下层摘要结构标签,根据系统用户使用频率自动调整互联网信息通用摘要数据库及信息发布通用模板结构标签;其中,数据挖掘人机交互模板中的主题关键词、语用关键词、语用关键词项下的普通关键词分别对应于互联网信息通用摘要数据库模版中的主题关键词、结构标签、结构标签下的用户输入信息;其中,所述的数据挖掘操作包括但不限于数据检索、统计、抽取、分析和相关模型化自动处理,以及根据用户需求对信息挖掘结果的自动整理;其中,所述的数据挖掘操作中的数据检索,是指用数据挖掘人机交互模板的关键词输入模板中获得的用户输入的所需挖掘信息的主题关键词、用户选择的语用关键词、语用关键词选择项下的普通关键词或组合结果对各类互联网信息进行检索,所述的数据挖掘操作中的统计操作,包括但不限于发布信息量统计、检索信息量统计、主题关键词、语用关键词、普通关键词的相关性统计、点击量统计,所述的数据挖掘操作中的数据分析包括但不限于历史数据演变分析、数据关联分析、未来趋势分析,所述的从数据挖掘人机交互模板的相关挖掘需求选择项中获得用户选择的相关需求包括但不限于时间、空间、地域、数据来源。
地址 400041 重庆市九龙坡区渝州路132号5单元20-4