发明名称 一种报表数据的图形化展示方法
摘要 本发明公开了一种报表数据的图形化展示方法,属于计算机系统数据分析领域,本发明要解决的技术问题为如何能够通过计算机自动解析出文档中出现频率较高的词语或者通过用户自定义词语的方式在定义范围内查找词语或者将上述两种方式融合使用,将用户自定义的词汇加入高发词库中。技术方案为:该方法包括如下步骤:(1)、读取excel或者文档文件;(2)、获取excel或文档文件中的表转换为json数据;(3)、分词和基于TF‑IDF算法的关键词抽取;(4)、调整词语序列;(5)、在excel或文档指定data中设置数据变量,形成高低分解模式,基于高低分解模式展示图表。
申请公布号 CN106484783A 申请公布日期 2017.03.08
申请号 CN201610829966.5 申请日期 2016.09.19
申请人 济南浪潮高新科技投资发展有限公司 发明人 王放
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 济南信达专利事务所有限公司 37100 代理人 罗文曌
主权项 一种报表数据的图形化展示方法,其特征在于该方法包括如下步骤:(1)、读取excel或者文档文件:通过用户指定路径的方式获取本地excel或者文档转存到内存中或者通过用户导入的方式获取导入的excel或者文档转存到内存中;(2)、获取excel或文档文件中的表转换为json数据:解析内存中的excel或者文档对象获取workbook对象,获取表格后解析指定区域内的有效数据信息,并将有效数据信息转化为json格式数据;(3)、分词和基于TF‑IDF算法的关键词抽取:将已有的有效数据信息做分词操作,返回指定个数的 TF‑IDF 权重最大的关键词;(4)、调整词语序列;(5)、在excel或文档指定data中设置数据变量,形成高低分解模式,基于高低分解模式展示图表。
地址 250100 山东省济南市高新区孙村镇科航路2877号研发楼一楼