发明名称 一种基于小波时序树状概要的城市公共数据流融合方法
摘要 一种基于小波时序树状概要的城市公共数据流融合方法,包括以下步骤:1)数据预处理;2)压缩处理;3)小波系数的筛选;4)基于小波变换的树状概要结构的动态维护:动态更新概要树的节点,根据数据节点可加性原则,将l<sub>i</sub>层上最老的m个节点合并到l<sub>i+1</sub>层,并将l<sub>i</sub>层余下的节点重新计数,同时将这m个老的数据移出内存,完成数据融合。本发明引入中位数绝对值偏差方法,结合离散小波变换方法,提出一种基于小波时序树状概要的城市公共数据流融合方法,能够高效、高质量得对城市公共数据流进行融合。
申请公布号 CN103049485B 申请公布日期 2015.10.21
申请号 CN201210511205.7 申请日期 2012.11.30
申请人 浙江工商大学 发明人 陈庭贵;许翀寰
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州天正专利事务所有限公司 33201 代理人 王兵;王利强
主权项 一种基于小波时序树状概要的城市公共数据流融合方法,其特征在于:所述融合方法包括以下步骤:1)数据预处理:开始到达的数据作为第0层,每一时间段到达的数据流片段平均包含m个数据,假设每m个数据组成一个子序列,记为d<sub>i</sub>,对d<sub>i</sub>进行预处理,包括对数据进行空缺值处理,去离群点;2)压缩处理:对每m个数据d<sub>i</sub>进行压缩操作,生成第1层的压缩数据节点P<sub>i</sub>,i=(1,2,3…),构造一个非线性衰减函数:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>f</mi><mi>i</mi></msub><mo>=</mo><mo>-</mo><mi>&alpha;</mi><msup><mi>e</mi><mrow><mo>-</mo><mrow><mo>(</mo><msub><mi>t</mi><mi>i</mi></msub><mo>-</mo><msub><mi>t</mi><mn>0</mn></msub><mo>)</mo></mrow></mrow></msup><mo>+</mo><mi>&beta;</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000703650430000014.GIF" wi="1215" he="98" /></maths>其中:α,β为衰减速度因子,α+β=1,α&gt;β,α,β∈[0,1],用于对衰减函数进行调整以提高精确度,t<sub>0</sub>表示初始时刻,则在时刻t<sub>i</sub>,数据节点P<sub>i</sub>的加权值为P<sub>i</sub>f<sub>i</sub>,数据节点的压缩采用离散小波变换,分量Φ中保存变换得到的r个最重要的小波系数;随着新数据的不断到来,第1层上的压缩数据节点不断增加,达到设定数量时,将最老的m个数据节点{P<sub>1</sub>’,P<sub>2</sub>’,…,P<sub>m</sub>’}进行归并,合并成第2层上的一个数据节点,并计算数据节点的概要信息,以此逐层向上,从而使得该数据流总是被压缩成一组分层次的数据节点;在整个计算过程中,内存中始终只存储n个数据节点,不断淘汰旧的数据;3)小波系数的筛选:规范化小波系数,将每个系数除以<img file="FDA0000703650430000011.GIF" wi="114" he="75" />即变化为<img file="FDA0000703650430000012.GIF" wi="652" he="86" />其中l是层数,重构误差的度量标准决定了最重要小波系数的选择,小波系数的筛选过程遵循以下原则:a、绝对值大的系数的缺失会对相关数据值的重构有更大的影响;b、从结构树上易知,越接近根节点的系数用于重构时影响的数据越多,具有更大的重要性,运用误差平方和sse:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>sse</mi><mrow><mo>(</mo><mi>D</mi><mo>,</mo><msup><mi>D</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msup><msub><mi>x</mi><mi>i</mi></msub><mo>&prime;</mo></msup><mo>)</mo></mrow><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000703650430000013.GIF" wi="1250" he="145" /></maths>来进行小波系数的筛选,系数重要性的衡量基于sse最小化,使得Φ中保留了r个绝对值最大的系数;4)基于小波变换的树状概要结构的动态维护:动态更新概要树的节点,根据数据节点可加性原则,将l<sub>i</sub>层上最老的m个节点合并到l<sub>i+1</sub>层,并将l<sub>i</sub>层余下的节点重新计数,同时将这m个老的数据移出内存,完成数据融合。
地址 310018 浙江省杭州市下沙高教园区学正街18号