发明名称 钢贸行业现货资源的数据解析方法及系统
摘要 本发明提供了一种钢贸行业现货资源的数据解析方法及系统,方法包括1)获取包含钢材现货资源的Excel文档作为待解析数据源;2)对所述待解析数据源进行识别分区;3)采用钢材标头特征库对识别分区后的每一区域的数据进行筛选,保留与钢材标头特征库匹配度最高的数据,从而确定所有目标区域;4)启动预处理程序对所有目标区域数据进行初步格式化;5)对预处理后所有目标区域范围内的数据进行抽取选样与所述钢材标头特征库提供的基础数据进行比对,确定数据行或数据列具体的代表名称;6)清洗比对后的数据,得到完整的数据信息并存储入库。本发明大幅提升了有效数据转化率。
申请公布号 CN104679819A 申请公布日期 2015.06.03
申请号 CN201410829896.4 申请日期 2014.12.22
申请人 上海钢富电子商务有限公司 发明人 衡宏昌;刘星辰
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海翼胜专利商标事务所(普通合伙) 31218 代理人 孙佳胤;翟羽
主权项 一种钢贸行业现货资源的数据解析方法,其特征在于,包括:(1)获取包含钢材现货资源的Excel文档作为待解析数据源;(2)对所述待解析数据源进行识别分区;(3)采用钢材标头特征库对识别分区后的每一区域的数据进行筛选,保留与钢材标头特征库匹配度最高的数据,从而确定所有目标区域,其中,钢材标头特征库为存放在数据库中的代表有效数据标头的一张穷举表;(4)启动预处理程序对所有目标区域数据进行初步格式化;(5)对预处理后所有目标区域范围内的数据进行抽取选样与所述钢材标头特征库提供的基础数据进行比对,确定数据行或数据列具体的代表名称;(6)清洗比对后的数据,得到完整的数据信息并存储入库。
地址 201815 上海市嘉定区嘉定工业区汇源路55号F幢2层E区208室