发明名称 一种具备人工行为学能力的行业特征分析器
摘要 本发明公开了一种具备人工行为学能力的行业特征分析器,涉及智能信息处理技术领域和大数据分析技术领域,包括可动态补充的行业特征样本库;分析器按一定策略从行业特征样本库中的两个样本集中抽取行业规则,形成行业分析规则库;在接受分析任务时,分析引擎根据行业分析规则库分析所输入未知特征文本,调整分析结果,辨识特征,实现学能力。
申请公布号 CN105512191A 申请公布日期 2016.04.20
申请号 CN201510836144.5 申请日期 2015.11.25
申请人 南京莱斯信息技术股份有限公司 发明人 张秋涵;吴小铭;金定勇;饶慧
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 南京苏高专利商标事务所(普通合伙) 32204 代理人 张弛
主权项 一种具备人工行为学习能力的行业特征分析器,其特征在于,包括分析任务调度器、分析引擎、规则库、样本处理引擎、行业特征样本库;行业特征样本库:包含多个行业特征样本,按行业分别存储,每个行业的样本又分为不分类样本集和分类样本集;分类样本指依业务需要,根据定义好的业务分类进行分组的样本;不分类样本指未经业务认定或分辨界限模糊,但是仍然具有价值的样本;样本处理引擎包含所需的数据挖掘算法;其中,对于分类样本:对每一类样本分别使用TF‑IDF获取特征词,计算权重,创建词条VSM;权重和VSM按给定分类存储入行业规则库,特征词按给定分类存储入行业特征词库;使用Apriori按样本集分类进行挖掘获取频繁特征短语和关联对象并建立向量,然后入行业规则库;对于不分类样本:使用K‑means对整个样本集进行聚类,根据聚合度提取特征词,然后入行业特征词库,给予分组标示;同时获得词关联关系,然后入行业规则库,给予分组标示;使用Apriori挖掘样本集获取频繁特征短语和关联对象并建立向量,然后入行业规则库行业分析规则库:包含行业特征词库、行业规则库;分析引擎:包含相似度匹配算法、特征标注算法,根据分析策略加载对应的行业分析规则信息分析输入信息;分析任务调度器:根据需求编排分析任务,和针对指定行业进行分析。
地址 210014 江苏省南京市光华路1号白下高新技术产业园内