主权项 |
一种基于小波时序树状概要的城市公共数据流融合方法,其特征在于:所述融合方法包括以下步骤:1)数据预处理:开始到达的数据作为第0层,每一时间段到达的数据流片段平均包含m个数据,假设每m个数据组成一个子序列,记为d<sub>i</sub>,对d<sub>i</sub>进行预处理,包括对数据进行空缺值处理,去离群点;2)压缩处理:对每m个数据d<sub>i</sub>进行压缩操作,生成第1层的压缩数据节点P<sub>i</sub>,i=(1,2,3…),构造一个非线性衰减函数:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>f</mi><mi>i</mi></msub><mo>=</mo><mo>-</mo><mi>α</mi><msup><mi>e</mi><mrow><mo>-</mo><mrow><mo>(</mo><msub><mi>t</mi><mi>i</mi></msub><mo>-</mo><msub><mi>t</mi><mn>0</mn></msub><mo>)</mo></mrow></mrow></msup><mo>+</mo><mi>β</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000703650430000014.GIF" wi="1215" he="98" /></maths>其中:α,β为衰减速度因子,α+β=1,α>β,α,β∈[0,1],用于对衰减函数进行调整以提高精确度,t<sub>0</sub>表示初始时刻,则在时刻t<sub>i</sub>,数据节点P<sub>i</sub>的加权值为P<sub>i</sub>f<sub>i</sub>,数据节点的压缩采用离散小波变换,分量Φ中保存变换得到的r个最重要的小波系数;随着新数据的不断到来,第1层上的压缩数据节点不断增加,达到设定数量时,将最老的m个数据节点{P<sub>1</sub>’,P<sub>2</sub>’,…,P<sub>m</sub>’}进行归并,合并成第2层上的一个数据节点,并计算数据节点的概要信息,以此逐层向上,从而使得该数据流总是被压缩成一组分层次的数据节点;在整个计算过程中,内存中始终只存储n个数据节点,不断淘汰旧的数据;3)小波系数的筛选:规范化小波系数,将每个系数除以<img file="FDA0000703650430000011.GIF" wi="114" he="75" />即变化为<img file="FDA0000703650430000012.GIF" wi="652" he="86" />其中l是层数,重构误差的度量标准决定了最重要小波系数的选择,小波系数的筛选过程遵循以下原则:a、绝对值大的系数的缺失会对相关数据值的重构有更大的影响;b、从结构树上易知,越接近根节点的系数用于重构时影响的数据越多,具有更大的重要性,运用误差平方和sse:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>sse</mi><mrow><mo>(</mo><mi>D</mi><mo>,</mo><msup><mi>D</mi><mo>′</mo></msup><mo>)</mo></mrow><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msup><msub><mi>x</mi><mi>i</mi></msub><mo>′</mo></msup><mo>)</mo></mrow><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000703650430000013.GIF" wi="1250" he="145" /></maths>来进行小波系数的筛选,系数重要性的衡量基于sse最小化,使得Φ中保留了r个绝对值最大的系数;4)基于小波变换的树状概要结构的动态维护:动态更新概要树的节点,根据数据节点可加性原则,将l<sub>i</sub>层上最老的m个节点合并到l<sub>i+1</sub>层,并将l<sub>i</sub>层余下的节点重新计数,同时将这m个老的数据移出内存,完成数据融合。 |