发明名称 一种基于PCA和LZW编码的道路交通空间数据压缩方法
摘要 一种基于PCA和LZW编码的道路交通空间数据压缩方法,基于同一模态下、空间上不同路段的道路交通数据建立道路交通特征参考序列;基于PCA选取具有相关性的道路交通路段集合;选择基准路段,将其数据作为空间上的道路交通基准数据;提取同一模态下、空间上其它路段的历史数据,作为训练数据,基于同一模态下、空间上的道路交通基准数据,确定空间道路交通差值数据的最优阈值;提取空间上其它路段的数据,作为实时数据;同一模态下、基于空间上的道路交通基准数据,获取道路交通差值数据;基于LZW编码实现道路交通空间数据的压缩;最后,基于LZW解码技术实现道路交通空间数据的重构。本发明简化计算、有效的提高处理速度。
申请公布号 CN105788261A 申请公布日期 2016.07.20
申请号 CN201610236010.4 申请日期 2016.04.15
申请人 浙江工业大学 发明人 徐东伟;王永东;张贵军;李章维;周晓根;郝小虎;丁情;吴浪
分类号 G08G1/01(2006.01)I;H03M7/30(2006.01)I 主分类号 G08G1/01(2006.01)I
代理机构 杭州斯可睿专利事务所有限公司 33241 代理人 王利强
主权项 一种基于PCA和LZW编码的道路交通空间数据压缩方法,其特征在于:所述方法包括以下步骤:1)基于同一模态下、空间上不同路段的道路交通数据建立道路交通特征参考序列;基于PCA方法,选取具有相关性的道路交通路段集合,其过程如下:从道理交通特征参考序列中提取s条路段的道路交通历史数据,每条路段的采集数据为r,并将其变换为s×r的矩阵,记为:A<sub>sⅹr</sub>;矩阵A<sub>sⅹr</sub>第j列的均值为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>a</mi><mi>j</mi></msub><mo>=</mo><mfrac><mn>1</mn><mi>s</mi></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>s</mi></munderover><msub><mi>A</mi><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000966216400000015.GIF" wi="874" he="123" /></maths>基于a<sub>j</sub>,获得A<sub>sⅹr</sub>的归一化矩阵SA<sub>sⅹr</sub>:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>SA</mi><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow></msub><mo>=</mo><mrow><mo>(</mo><msub><mi>A</mi><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow></msub><mo>-</mo><msub><mi>a</mi><mi>j</mi></msub><mo>)</mo></mrow><msup><mrow><mo>(</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>s</mi></munderover><msup><mrow><mo>(</mo><mrow><msub><mi>A</mi><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow></msub><mo>-</mo><msub><mi>a</mi><mi>j</mi></msub></mrow><mo>)</mo></mrow><mn>2</mn></msup><mo>)</mo></mrow><mrow><mo>-</mo><mfrac><mn>1</mn><mn>2</mn></mfrac></mrow></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000966216400000011.GIF" wi="1173" he="154" /></maths>归一化矩阵SA的协方差矩阵CSA为:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>C</mi><mi>S</mi><mi>A</mi><mo>=</mo><mfrac><mn>1</mn><mrow><mi>s</mi><mo>-</mo><mn>1</mn></mrow></mfrac><mrow><mo>(</mo><msup><mi>SA</mi><mi>T</mi></msup><mo>*</mo><mi>S</mi><mi>A</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000966216400000012.GIF" wi="1109" he="126" /></maths>获得协方差矩阵CSA的特征值D和特征向量V,则D=[λ<sub>1</sub>,λ<sub>2</sub>…λ<sub>r</sub>];λ<sub>1</sub>≥λ<sub>2</sub>≥…≥λ<sub>r</sub>;对应的特征向量为:V=[v<sub>1</sub>,v<sub>2</sub>…v<sub>r</sub>];选取λ<sub>1</sub>,λ<sub>2</sub>对应的特征向量构成的投影矩阵VA<sub>r×2</sub>=[v<sub>1</sub>,v<sub>2</sub>],基于投影矩阵和归一化的训练矩阵,求取A<sub>sⅹr</sub>的主成分矩阵APC<sub>r×2</sub>:APC<sub>s×2</sub>=SA<sub>sⅹr</sub>×VA<sub>r×2</sub>   (4)基于APC<sub>s×2</sub>,在二维平面上画出s条路段的分布,点的分布疏密表示对应路段相关性强度,通过相关性分析,设定阈值δ,选择相关性大于δ的p+1条路段,其过程如下:<img file="FDA0000966216400000013.GIF" wi="926" he="71" />其中,i,j分别表示第i、j条路段,0&lt;i&lt;s,0&lt;j&lt;s;<img file="FDA0000966216400000014.GIF" wi="40" he="51" />表示相关性函数;2)选择基准路段,并将其数据作为空间上的道路交通基准数据;提取同一模态下、空间上其它路段的历史数据,作为训练数据,基于同一模态下、空间上的道路交通基准数据,确定空间道路交通差值数据的最优阈值,其过程如下:S<sub>i</sub>(m*Δt,M<sub>gh</sub>)=ST<sub>i</sub>(m*Δt,M<sub>gh</sub>)‑SB(m*Δt,M<sub>gh</sub>)   (6)e<sub>i</sub>(m,M<sub>gh</sub>)=[S<sub>i</sub>(Δt,M<sub>gh</sub>)S<sub>i</sub>(2*Δt,M<sub>gh</sub>)...S<sub>i</sub>(m*Δt,M<sub>gh</sub>)]   (7)<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>he</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>m</mi><mo>,</mo><msub><mi>M</mi><mrow><mi>g</mi><mi>h</mi></mrow></msub><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><mn>0</mn><mo>,</mo></mrow></mtd><mtd><mrow><msub><mi>e</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>m</mi><mo>,</mo><msub><mi>M</mi><mrow><mi>g</mi><mi>h</mi></mrow></msub><mo>)</mo></mrow><mo>&lt;</mo><msub><mi>E</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>m</mi><mo>,</mo><msub><mi>M</mi><mrow><mi>g</mi><mi>h</mi></mrow></msub><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>e</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>m</mi><mo>,</mo><msub><mi>M</mi><mrow><mi>g</mi><mi>h</mi></mrow></msub><mo>)</mo></mrow><mo>,</mo></mrow></mtd><mtd><mrow><msub><mi>e</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>m</mi><mo>,</mo><msub><mi>M</mi><mrow><mi>g</mi><mi>h</mi></mrow></msub><mo>)</mo></mrow><mo>&gt;</mo><msub><mi>E</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>m</mi><mo>,</mo><msub><mi>M</mi><mrow><mi>g</mi><mi>h</mi></mrow></msub><mo>)</mo></mrow></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>8</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000966216400000021.GIF" wi="1558" he="158" /></maths>pe<sub>i</sub>(n,M<sub>gh</sub>)=w(he<sub>i</sub>(m,M<sub>gh</sub>))   (9)pe<sub>i</sub>(n,M<sub>gh</sub>)=[S<sub>i</sub>'(1,M<sub>gh</sub>)S<sub>i</sub>'(2,M<sub>gh</sub>)...S<sub>i</sub>'(n,M<sub>gh</sub>)]   (10)其中,Δt为道路交通状态数据的采集周期;(m*Δt)为第m个道路交通状态数据采集周期,0≤m≤N,N表示每天采集的交通信息的数量;i(1≤i≤p)表示第i条路段;ST<sub>i</sub>(m*Δt,M<sub>gh</sub>)表示模态M<sub>gh</sub>下、(m*Δt)时刻i路段的道路交通数据;SB(m*Δt,M<sub>gh</sub>)表示模态M<sub>gh</sub>下、(m*Δt)时刻基准路段的基准数据;S<sub>i</sub>(m*Δt,M<sub>gh</sub>)表示模态M<sub>gh</sub>下、(m*Δt)时刻i路段的训练数据与基准路段的基准数据的差值数据;e<sub>i</sub>(m,M<sub>gh</sub>)表示模态M<sub>gh</sub>下、Δt到(m*Δt)时段i路段的训练数据与基准路段的基准数据的差值数据;he<sub>i</sub>(m,M<sub>gh</sub>)表示模态M<sub>gh</sub>下、Δt到(m*Δt)时段阈值处理后i路段的训练数据与基准路段的基准数据的差值数据;E<sub>i</sub>(m,M<sub>gh</sub>)表示模态M<sub>gh</sub>下、Δt到(m*Δt)时段i路段选取的阈值;pe<sub>i</sub>(n,M<sub>gh</sub>)表示模态M<sub>gh</sub>下、Δt到(m*Δt)时段i路段与基准路段的差值数据经LZW编码后的结果;S<sub>i</sub>’(n,M<sub>gh</sub>)为模态M<sub>gh</sub>下、Δt到(m*Δt)时段i路段与基准路段的差值数据经LZW编码后的结果中第n个数据;m表示在模态M<sub>gh</sub>下、Δt到(m*Δt)时段压缩前的i路段与基准路段的差值数据的数量;n表示在模态M<sub>gh</sub>下、Δt到(m*Δt)时段压缩后的道路交通数量;w表示LZW编码;压缩比为<img file="FDA0000966216400000031.GIF" wi="75" he="105" />3)提取空间上其它路段的数据,作为实时数据;模态M<sub>gh</sub>下、基于空间上的道路交通基准数据,获取道路交通差值数据,其一般表达式如下:MS<sub>j</sub>(m*Δt,M<sub>gh</sub>)=SM<sub>j</sub>(m*Δt,M<sub>gh</sub>)‑SB(m*Δt,M<sub>gh</sub>)   (11)err<sub>j</sub>(m,M<sub>gh</sub>)=[MS<sub>j</sub>(Δt,M<sub>gh</sub>)MS<sub>j</sub>(2*Δt,M<sub>gh</sub>)...MS<sub>j</sub>(m*Δt,M<sub>gh</sub>)]   (12)其中,j(1≤i≤p)表示第j条路段;SM<sub>j</sub>(m*Δt,M<sub>gh</sub>)表示模态M<sub>gh</sub>下、(m*Δt)时刻j路段的实时数据;MS<sub>j</sub>(m*Δt,M<sub>gh</sub>)为模态M<sub>gh</sub>下、(m*Δt)时刻j路段的实时数据与基准路段的基准数据的差值数据;err<sub>j</sub>(m,M<sub>gh</sub>)为模态M<sub>gh</sub>下、Δt到(m*Δt)时段j路段的实时数据与基准路段的基准数据的差值数据;4)基于LZW编码实现道路交通空间数据的压缩,其过程如下:将i路段与基准路段的差值数据训练的最佳阈值引入到同一模态M<sub>gh</sub>、j路段与基准路段的差值数据中,结合LZW编码,实现j路段与基准路段差值数据的压缩,其一般表达式如下:<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msub><mi>herr</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>m</mi><mo>*</mo><mi>&Delta;</mi><mi>t</mi><mo>,</mo><msub><mi>M</mi><mrow><mi>g</mi><mi>h</mi></mrow></msub><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><mn>0</mn><mo>,</mo><msub><mi>err</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>m</mi><mo>*</mo><mi>&Delta;</mi><mi>t</mi><mo>,</mo><msub><mi>M</mi><mrow><mi>g</mi><mi>h</mi></mrow></msub><mo>)</mo></mrow><mo>&lt;</mo><msub><mi>E</mi><mrow><mi>o</mi><mi>p</mi><mi>t</mi></mrow></msub><mrow><mo>(</mo><msub><mi>M</mi><mrow><mi>g</mi><mi>h</mi></mrow></msub><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>err</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>m</mi><mo>*</mo><mi>&Delta;</mi><mi>t</mi><mo>,</mo><msub><mi>M</mi><mrow><mi>g</mi><mi>h</mi></mrow></msub><mo>)</mo></mrow><mo>,</mo><msub><mi>err</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>m</mi><mo>,</mo><msub><mi>M</mi><mrow><mi>g</mi><mi>h</mi></mrow></msub><mo>)</mo></mrow><mo>&gt;</mo><msub><mi>E</mi><mrow><mi>o</mi><mi>p</mi><mi>t</mi></mrow></msub><mrow><mo>(</mo><msub><mi>M</mi><mrow><mi>g</mi><mi>h</mi></mrow></msub><mo>)</mo></mrow></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>13</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000966216400000032.GIF" wi="1630" he="159" /></maths>herrs<sub>p</sub>(m*Δt,M<sub>gh</sub>)=[herr<sub>1</sub>(m*Δt,M<sub>gh</sub>)herr<sub>2</sub>(Δt,M<sub>gh</sub>)...herr<sub>p'</sub>(m*Δt,M<sub>gh</sub>)]   (14)perr<sub>p'</sub>(m*Δt,M<sub>gh</sub>)=w(herrs<sub>p</sub>(m*Δt,M<sub>gh</sub>))   (15)perr<sub>p'</sub>(m*Δt,M<sub>gh</sub>)=[MS<sub>1</sub>(m*Δt,M<sub>gh</sub>)MS<sub>2</sub>(m*Δt,M<sub>gh</sub>)...MS<sub>p'</sub>(m*Δt,M<sub>gh</sub>)]   (16)其中,E<sub>opt</sub>(M<sub>gh</sub>)表示训练的最优阈值;herr<sub>j</sub>(m*Δt,M<sub>gh</sub>)表示模态M<sub>gh</sub>下、(m*Δt)时刻阈值处理后j路段的实时数据与基准路段的基准数据的差值数据;m表示模态M<sub>gh</sub>下、Δt到(m*Δt)时段压缩前j路段与基准路段的差值数据的数量;herrs<sub>p</sub>(m*Δt,M<sub>gh</sub>)表示模态M<sub>gh</sub>下、(m*Δt)时刻p条路段差值数据的数量集合;Perr<sub>p’</sub>(m*Δt,M<sub>gh</sub>)表示模态M<sub>gh</sub>下、(m*Δt)时刻p条路段压缩后差值数据的数量集合;MS<sub>j</sub>’(m*Δt,M<sub>gh</sub>)表示模态M<sub>gh</sub>下、(m*Δt)时刻,j路段的差值数据压缩后的数量;p’表示(m*Δt)时刻LZW编码后的数量;压缩比为:<img file="FDA0000966216400000041.GIF" wi="94" he="118" />
地址 310014 浙江省杭州市下城区朝晖六区潮王路18号