发明名称 一种对时间序列进行建模并识别的方法
摘要 本发明涉及一种对时间序列进行建模并识别的方法,属于机器学领域。该方法包括将传感器采集的数据按采集时间先后顺序排列而成的动态数据构成L条时间序列,随机选择L条时间序列中的60%‑80%的N条时间序列作为训练集,剩下的时间序列作为测试集;对训练集中的每一条时间序列采用线性动态系统模型进行建模,并训练集每一条时间序列的特征表示;随机从训练集中抽取J条时间序列作为字典组成字典集,从得到的训练集每一条训练时间序列的特征表示,学出字典集的每一条时间序列的最优特征表示,同时计算每一条训练时间序列在字典集下的编码系数;用训练集的编码系数训练支持向量机模型,实现对时间序列的识别。本方法大幅降低了数据表示的复杂度,同时显著提高识别精度。
申请公布号 CN106295703A 申请公布日期 2017.01.04
申请号 CN201610671152.3 申请日期 2016.08.15
申请人 清华大学 发明人 孙富春;黄文炳;曹乐乐;杨豪琳
分类号 G06K9/62(2006.01)I;G06K9/46(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人 廖元秋
主权项 一种对时间序列进行建模并识别的方法,其特征在于,该方法包括以下步骤:1)将传感器采集的数据按采集时间先后顺序排列而成的动态数据构成L条时间序列,随机选择L条时间序列中的60%‑80%的N条时间序列作为训练集,剩下的时间序列作为测试集;2)对训练集中的每一条时间序列采用线性动态系统模型进行建模:<maths num="0001"><math><![CDATA[<mrow><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><mi>x</mi><mrow><mo>(</mo><mi>t</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>=</mo><mi>A</mi><mi>x</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><mi>v</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow><mi>y</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mi>C</mi><mi>x</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><mi>w</mi><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001078958800000011.GIF" wi="741" he="150" /></maths>其中,已知变量为:时间序列Y=(y(0),y(1),…,y(t),…,y(τ))(τ为正整数,表示时间序列的时间长度);未知变量是:序列状态X=(x(0),x(1),…,x(t),…,x(τ)),描述空间纹理的测量矩阵C,描述动态变化的转移矩阵A,模型的噪声项v(t)和w(t);根据已知变量Y求解未知变量X,C,A,得到训练集每一条时间序列的特征表示;3)随机从训练集中抽取J条时间序列作为字典组成字典集,由步骤2)得到的训练集每一条训练时间序列的特征表示,学习出字典集的每一条时间序列的最优特征表示,同时计算得到每一条训练时间序列在字典集下的编码系数;4)用步骤3)得到的训练集的编码系数α<sub>1</sub>,α<sub>2</sub>,…,α<sub>N</sub>训练支持向量机模型,实现对时间序列的识别。
地址 100084 北京市海淀区清华园1号