发明名称 一种钢铁企业高炉副产煤气发生量预测方法
摘要 本发明公开了一种钢铁企业高炉副产煤气发生量预测方法,包括如下步骤:从钢铁企业现场的实时数据库中读取高炉煤气的产生量数据;对所收集的原始数据序列进行预处理,检测出高炉煤气数据序列中的异常值;将经过预处理的数据序列输入建立的最小二乘支持向量机模型中进行预测,并用改进的粒子群算法优化最小二乘支持向量机的核宽度参数和惩罚因子参数,提高预测精度。本发明能够较为准确、快速的检测出高炉煤气产生量中的异常数据,并且对原始数据进行异常数据替换;建立了一种基于结构风险最小化的最小二乘支持向量预测模型,并用改进的粒子群算法对其优化,提高了模型的预测精度,预测结果可以为煤气资源的合理利用提供依据。
申请公布号 CN104866923A 申请公布日期 2015.08.26
申请号 CN201510269863.3 申请日期 2015.05.17
申请人 天津理工大学 发明人 王红君;白鹏;岳有军;赵辉
分类号 G06Q10/04(2012.01)I;G06Q50/04(2012.01)I 主分类号 G06Q10/04(2012.01)I
代理机构 代理人
主权项 一种钢铁企业高炉副产煤气发生量预测方法,其特征在于,包括如下步骤:S1、从钢铁企业现场的实时数据库中读取高炉煤气的产生量数据;S2、对步骤S1所收集的原始数据序列进行预处理,检测出高炉煤气数据序列中的异常值;S21、利用五数总括法对步骤S1所收集的原始数据序列进行处理以缩小异常检测的范围;具体的,记高炉煤气的数据序列为F,把F按照从大到小的顺序排列,确定出数据序列的中位数F<sub>m</sub>、上下四分位数F<sub>u</sub>与F<sub>l</sub>,将上下四分位数之差表示为d<sub>f</sub>;数据序列的上截断点和下截断点分别表示成F<sub>u</sub>+1.5d<sub>f</sub>与F<sub>u</sub>‑1.5d<sub>f</sub>,在此定义上下截断点两侧的数据即为疑似的异常数据序列;S22、将步骤821所得的疑似异常数据利用局部异常因子法检验离群值,具体步骤如下:a)计算要检测的煤气发生量数据p的k距离,对任意给定的正整数k,对象p的k距离被定义为数据对象p与另一个对象o之间的欧氏距离,记为:k‑distance(p);b)计算对象p的k距离邻域N<sub>k‑distance</sub>,对象p的k距离邻域定义为所有与煤气数据p之间距离不大于k的对象全体,可表示为:N<sub>k‑distance</sub>={q∈D/{p}|d(p,q)≤k‑distance(p)}c)计算煤气数据p的可达距离,相对于对象数据o,p的可达距离定义为:Reach‑dist(p,o)=max{k‑distance(o),d(p,o)}d)通过以下公式计算待检测数据p的局部可达密度,<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>lrd</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>/</mo><mo>{</mo><mfrac><mrow><munder><mi>&Sigma;</mi><mrow><mi>o</mi><mo>&Element;</mo><msub><mi>N</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow></msub></mrow></munder><mi>reach</mi><mo>-</mo><mi>dist</mi><mrow><mo>(</mo><mi>p</mi><mo>,</mo><mi>o</mi><mo>)</mo></mrow></mrow><mrow><mo>|</mo><mi>N</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>|</mo></mrow></mfrac><mo>}</mo></mrow>]]></math><img file="FSA0000117231160000011.GIF" wi="670" he="174" /></maths>式中,<img file="FSA0000117231160000021.GIF" wi="426" he="92" />为p邻域内所有对象的可达距离之和;N(p)为可达距离对象的个数;e)通过以下公式计算待检测数据的局部异常因子<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mrow><mi>LOF</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><munder><mi>&Sigma;</mi><mrow><mi>o</mi><mo>&Element;</mo><msub><mi>N</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow></msub></mrow></munder><mfrac><mrow><mi>lrd</mi><mrow><mo>(</mo><mi>o</mi><mo>)</mo></mrow></mrow><mrow><mi>lrd</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow></mrow></mfrac></mrow><mrow><mo>|</mo><mi>N</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>|</mo></mrow></mfrac></mrow><mo>;</mo></mrow>]]></math><img file="FSA0000117231160000022.GIF" wi="659" he="198" /></maths>式中,lrd(o)表示所有数据对象的局部可达密度,lrd(p)表示待检测的数据对象的局部可达密度,N(p)为可达距离对象的个数;S3、将经过预处理的数据序列输入建立的最小二乘支持向量机模型中进行预测,并用改进的粒子群算法优化最小二乘支持向量机的核宽度参数和惩罚因子参数,提高预测精度。
地址 300384 天津市西青区宾水西道391号