发明名称 基于平衡板使用者健康状态动态监测方法
摘要 本发明公开了一种基于平衡板使用者健康状态动态监测方法。现有的方法不能够及时有效的解决使用者健康状态监测问题且处理程序繁琐。本发明首先采集wii平衡板使用者的训练数据,接着对数据进行预处理,然后提取处理后的数据的语义特征,接着用此语义特征作为观测量进行正常状态知识的累积即HMM的训练,最后利用获取的模型和语义特征进行健康状态变化的判断。本发明利用基于平衡板使用者健康状态动态监测算法,实现快速精确监测,边监测边训练边累积正常状态知识的目的,并较好地解决了使用者健康状态未知情况下的监测问题,从而将使监测更加智能。
申请公布号 CN103077302A 申请公布日期 2013.05.01
申请号 CN201210574024.9 申请日期 2012.12.25
申请人 杭州电子科技大学 发明人 郭春生;岳猛;胡典荣;徐俊;董秀青
分类号 G06F19/00(2006.01)I;A61B5/00(2006.01)I 主分类号 G06F19/00(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 杜军
主权项 1. 基于平衡板使用者健康状态动态监测方法,其特征在于该方法的具体步骤是:步骤一:平衡数据采集,具体是:平衡板四个角的压力传感器感受到压力的作用,产生四路电压信号,将这四路电压信号经过计算可得出使用者压力重心在平衡板的投影位置,四个传感器的位置坐标为<img file="DEST_PATH_IMAGE002.GIF" wi="208" he="25" />,为了得到大量的训练数据,将相邻两个传感器产生数据进行差分处理,得到AB两个位置坐标的差分数据<img file="DEST_PATH_IMAGE004.GIF" wi="100" he="25" />,AC位置坐标的差分数据<img file="DEST_PATH_IMAGE006.GIF" wi="102" he="25" />, CD 位置坐标的差分数据<img file="DEST_PATH_IMAGE008.GIF" wi="101" he="25" />,AD位置坐标的差分数据<img file="DEST_PATH_IMAGE010.GIF" wi="76" he="25" />,<img file="DEST_PATH_IMAGE012.GIF" wi="32" he="25" />表示A位置的x减去B位置的x的差值,<img file="DEST_PATH_IMAGE014.GIF" wi="32" he="25" />表示A位置的y减去B位置的y的差值,<img file="DEST_PATH_IMAGE016.GIF" wi="32" he="25" />表示B位置的x减去C位置的x的差值,<img file="DEST_PATH_IMAGE018.GIF" wi="32" he="25" />表示B位置的y减去C位置的y的差值,<img file="DEST_PATH_IMAGE020.GIF" wi="32" he="25" />表示C位置的x减去D位置的x的差值,<img file="DEST_PATH_IMAGE022.GIF" wi="32" he="25" />表示C位置的y减去D位置的y的差值,<img file="DEST_PATH_IMAGE024.GIF" wi="32" he="25" />表示A位置的x减去D位置的x的差值,<img file="DEST_PATH_IMAGE026.GIF" wi="32" he="25" />表示A位置的y减去D位置的y的差值;同时将获取的差分数据进行均方差处理:<img file="DEST_PATH_IMAGE028.GIF" wi="218" he="42" /><img file="DEST_PATH_IMAGE030.GIF" wi="220" he="42" /><img file="DEST_PATH_IMAGE032.GIF" wi="480" he="90" />其中<img file="DEST_PATH_IMAGE034.GIF" wi="26" he="25" />表示四个坐标位置的x值的均值,<img file="DEST_PATH_IMAGE036.GIF" wi="26" he="26" />表示四个坐标位置的y值的均值,<img file="DEST_PATH_IMAGE038.GIF" wi="54" he="25" />表示四个坐标位置的x值的均方差,<img file="DEST_PATH_IMAGE040.GIF" wi="56" he="26" />表示四个坐标位置的y值的均方差,<img file="DEST_PATH_IMAGE042.GIF" wi="81" he="22" /><img file="DEST_PATH_IMAGE044.GIF" wi="13" he="20" />表示均方差位置坐标;将上述获取的9组数据<img file="DEST_PATH_IMAGE046.GIF" wi="60" he="25" />,<img file="DEST_PATH_IMAGE048.GIF" wi="62" he="25" />,<img file="795824DEST_PATH_IMAGE048.GIF" wi="62" he="25" />,<img file="DEST_PATH_IMAGE050.GIF" wi="65" he="25" />,<img file="584920DEST_PATH_IMAGE044.GIF" wi="13" he="20" /><img file="187940DEST_PATH_IMAGE004.GIF" wi="100" he="25" />,<img file="142995DEST_PATH_IMAGE008.GIF" wi="101" he="25" />,<img file="DEST_PATH_IMAGE052.GIF" wi="100" he="25" />,<img file="540478DEST_PATH_IMAGE052.GIF" wi="100" he="25" />,<img file="82449DEST_PATH_IMAGE042.GIF" wi="81" he="22" />组成9维的训练数据data:<img file="DEST_PATH_IMAGE054.GIF" wi="402" he="49" />步骤二:数据的预处理,具体是:将得到训练数据data,通过数据清洗去掉噪声和无关的数据,通过数据变换将数据转化成为适合信息处理的形式,即处理为LDA可以使用的文档形式;步骤三:LDA提取数据语义特征 ,具体是:LDA将每个文档表示为一个主题混合,每个主题是固定词表上的一个多项式分布;LDA假设文档由一个主题混合产生,同时每个主题是在固定词表上的一个多项式分布;这些主题被集合中的所有文档共享;每个文档有一个特定的主题混合比例,其从Dirichlet分布中抽样产生;作为一种生成式文档模型,用LDA提取文档的隐含语义结构和文档表征已经成功地应用到很多文本相关的领域;具体来说生成LDA生成过程如下:1)选择N,N服从<img file="DEST_PATH_IMAGE056.GIF" wi="78" he="22" />分布,N表示每篇文档的词汇量;2)选择<img file="DEST_PATH_IMAGE058.GIF" wi="14" he="20" />,<img file="597482DEST_PATH_IMAGE058.GIF" wi="14" he="20" />服从<img file="DEST_PATH_IMAGE060.GIF" wi="88" he="22" />分布,<img file="908509DEST_PATH_IMAGE058.GIF" wi="14" he="20" />是主题先验参数,<img file="DEST_PATH_IMAGE062.GIF" wi="17" he="16" />是<img file="794337DEST_PATH_IMAGE058.GIF" wi="14" he="20" />的先验分布;3)选择主题参数<img file="DEST_PATH_IMAGE064.GIF" wi="25" he="25" />,<img file="72872DEST_PATH_IMAGE064.GIF" wi="25" he="25" />服从<img file="DEST_PATH_IMAGE066.GIF" wi="106" he="22" />分布;4)选择词汇参数<img file="DEST_PATH_IMAGE068.GIF" wi="28" he="25" />,<img file="830743DEST_PATH_IMAGE068.GIF" wi="28" he="25" />服从<img file="DEST_PATH_IMAGE070.GIF" wi="122" he="26" />分布,其中<img file="DEST_PATH_IMAGE072.GIF" wi="29" he="26" />是主题词项分布矩阵;主题模型的推理是生成文档的逆向过程,已知<img file="557129DEST_PATH_IMAGE062.GIF" wi="17" he="16" />和先验分布<img file="DEST_PATH_IMAGE074.GIF" wi="17" he="22" />,根据文档生成过程可以写出各种随机变量<img file="DEST_PATH_IMAGE076.GIF" wi="17" he="18" />、<img file="DEST_PATH_IMAGE078.GIF" wi="14" he="14" />和<img file="DEST_PATH_IMAGE080.GIF" wi="14" he="20" />的联合概率,其中<img file="DEST_PATH_IMAGE082.GIF" wi="129" he="25" />,表示文档集合,<img file="748944DEST_PATH_IMAGE078.GIF" wi="14" he="14" />表示主题,<img file="DEST_PATH_IMAGE084.GIF" wi="102" he="25" />表示各个词汇,其下标表示此词汇是第多少个词汇;<img file="DEST_PATH_IMAGE086.GIF" wi="380" he="49" />其中M表示文档数目,<img file="DEST_PATH_IMAGE088.GIF" wi="21" he="25" />是第m篇文档的主题分布;对主题先验参数<img file="373830DEST_PATH_IMAGE058.GIF" wi="14" he="20" />进行积分得到<img file="DEST_PATH_IMAGE090.GIF" wi="89" he="22" />,则根据贝叶斯公式,<img file="DEST_PATH_IMAGE092.GIF" wi="254" he="46" />其中,<img file="DEST_PATH_IMAGE094.GIF" wi="20" he="25" />表示除第<img file="DEST_PATH_IMAGE096.GIF" wi="18" he="16" />篇文档中第<img file="DEST_PATH_IMAGE098.GIF" wi="14" he="16" />篇词汇所对应的主题词,<img file="DEST_PATH_IMAGE100.GIF" wi="25" he="25" />表示除第<img file="100172DEST_PATH_IMAGE096.GIF" wi="18" he="16" />篇文档中第<img file="385791DEST_PATH_IMAGE098.GIF" wi="14" he="16" />篇词汇所对应的主题词以外,其它所有的已知文档中的词汇所对应的主题词,<img file="DEST_PATH_IMAGE102.GIF" wi="17" he="16" />表示文档词汇;上式可用来完成主题参数的估计,即确定其对应的具有语义特征的关键词;给定<img file="295978DEST_PATH_IMAGE062.GIF" wi="17" he="16" />和<img file="532793DEST_PATH_IMAGE074.GIF" wi="17" he="22" />情况下,主题先验参数<img file="757101DEST_PATH_IMAGE080.GIF" wi="14" he="20" />、主题<img file="146494DEST_PATH_IMAGE078.GIF" wi="14" he="14" />以及每篇文档词汇<img file="243894DEST_PATH_IMAGE102.GIF" wi="17" he="16" />的联合分布可以表示为:<img file="DEST_PATH_IMAGE104.GIF" wi="322" he="46" />其中,整合<img file="718738DEST_PATH_IMAGE080.GIF" wi="14" he="20" />和<img file="792742DEST_PATH_IMAGE078.GIF" wi="14" he="14" />,得到一个词汇的边缘分布:<img file="DEST_PATH_IMAGE106.GIF" wi="390" he="54" />依据上面的边缘分布,得到M篇文档概率分布为:<img file="DEST_PATH_IMAGE108.GIF" wi="422" he="54" />其中,D代表M篇文档集合,<img file="849691DEST_PATH_IMAGE096.GIF" wi="18" he="16" />表示第<img file="367260DEST_PATH_IMAGE096.GIF" wi="18" he="16" />篇文档标签序号;然后计算给定一篇文档条件下隐藏变量的后验分布,公式如下所述:<img file="DEST_PATH_IMAGE110.GIF" wi="217" he="45" />此后验分布采用变分EM算法进行推理可得到,取Q分布的函数<img file="DEST_PATH_IMAGE112.GIF" wi="81" he="22" />去逼近<img file="DEST_PATH_IMAGE114.GIF" wi="102" he="22" />,其中Q分布的形式如下:<img file="DEST_PATH_IMAGE116.GIF" wi="222" he="46" />其中<img file="DEST_PATH_IMAGE118.GIF" wi="14" he="18" />表示狄利克雷参数,<img file="DEST_PATH_IMAGE120.GIF" wi="16" he="18" />表示多项式参数,<img file="DEST_PATH_IMAGE122.GIF" wi="20" he="25" />表示多项式的第n个参数;为了得到最佳的变分参数将变分分布<img file="DEST_PATH_IMAGE124.GIF" wi="80" he="22" />和真实分布<img file="DEST_PATH_IMAGE126.GIF" wi="104" he="22" />之间的KL散度最小化,最小值可以通过迭代的方法获得;通过推导可得到<img file="958428DEST_PATH_IMAGE120.GIF" wi="16" he="18" />和<img file="524539DEST_PATH_IMAGE118.GIF" wi="14" he="18" />的迭代公式:<img file="DEST_PATH_IMAGE128.GIF" wi="22" he="25" /><img file="DEST_PATH_IMAGE130.GIF" wi="17" he="14" /><img file="DEST_PATH_IMAGE132.GIF" wi="156" he="26" /><img file="DEST_PATH_IMAGE134.GIF" wi="116" he="32" />其中:<img file="DEST_PATH_IMAGE136.GIF" wi="232" he="33" />,表示在<img file="183797DEST_PATH_IMAGE118.GIF" wi="14" he="18" />条件下<img file="DEST_PATH_IMAGE138.GIF" wi="17" he="25" />的条件概率期望值,<img file="DEST_PATH_IMAGE140.GIF" wi="18" he="18" />是对数伽玛函数,<img file="DEST_PATH_IMAGE142.GIF" wi="29" he="26" />是条件多项式参数,<img file="DEST_PATH_IMAGE144.GIF" wi="18" he="25" />表示第i次迭代时的狄利克雷参数;更新Dirichlet参数<img file="139113DEST_PATH_IMAGE062.GIF" wi="17" he="16" />用的是Newton-Raphson方法;通过上述的推理,得到新参数<img file="401598DEST_PATH_IMAGE118.GIF" wi="14" he="18" />的估计值,其中携带了是每次使用者产生平衡数据组成文档的语义特征;这样就完成了LDA提取数据的语义特征的过程;步骤四:正常状态知识的训练,具体是:HMM异常检测包含两个部分,前一个部分是对事件的评估,后一部分是参数的学习,参数学习就是模型参数未知,求最佳模型参数<img file="DEST_PATH_IMAGE146.GIF" wi="16" he="20" />的问题;将使用者产生的数据组成的数据文档的语义特征视为HMM模型的观测量<img file="DEST_PATH_IMAGE148.GIF" wi="113" he="25" />;隐马尔可夫模型的第三个问题是如何根据观察序列<img file="879721DEST_PATH_IMAGE148.GIF" wi="113" he="25" />,求得模型参数或调整模型参数<img file="848946DEST_PATH_IMAGE146.GIF" wi="16" he="20" />,使得<img file="DEST_PATH_IMAGE150.GIF" wi="56" he="22" />最大;而第三个问题是通过前向-后向算法解决的;前向-后向算法首先定义两个变量,给定观察序列O和隐马尔可夫模型<img file="19902DEST_PATH_IMAGE146.GIF" wi="16" he="20" />,定义t时刻位于隐藏状态<img file="DEST_PATH_IMAGE152.GIF" wi="17" he="25" />的概率变量为:<img file="DEST_PATH_IMAGE154.GIF" wi="148" he="25" />;根据前向变量<img file="DEST_PATH_IMAGE156.GIF" wi="36" he="25" />和后向变量<img file="DEST_PATH_IMAGE158.GIF" wi="36" he="25" />的定义,将上式子用前向,后向变量表示:<img file="DEST_PATH_IMAGE160.GIF" wi="212" he="66" />其中分母是保证:<img file="DEST_PATH_IMAGE162.GIF" wi="74" he="46" />;后向变量为:<img file="DEST_PATH_IMAGE164.GIF" wi="368" he="38" />;给定观察序列O和隐马尔可夫模型<img file="815688DEST_PATH_IMAGE146.GIF" wi="16" he="20" />,定义t时刻位于隐藏状态<img file="306624DEST_PATH_IMAGE152.GIF" wi="17" he="25" />及t+1时刻位于隐藏状态<img file="DEST_PATH_IMAGE166.GIF" wi="20" he="26" />的概率变量为:<img file="DEST_PATH_IMAGE168.GIF" wi="217" he="26" />同时该变量可有前向-后向变量表示:<img file="DEST_PATH_IMAGE170.GIF" wi="390" he="70" />上述定义的两个变量也存在着如下关系:<img file="DEST_PATH_IMAGE172.GIF" wi="112" he="48" />而且<img file="DEST_PATH_IMAGE174.GIF" wi="53" he="46" />表示观察序列O中从状态<img file="566573DEST_PATH_IMAGE152.GIF" wi="17" he="25" />出发的转移期望概率,<img file="DEST_PATH_IMAGE176.GIF" wi="68" he="46" />表示观察序列中从状态<img file="596846DEST_PATH_IMAGE152.GIF" wi="17" he="25" />转移到状态<img file="506028DEST_PATH_IMAGE166.GIF" wi="20" he="26" />的转移期望概率,定义了两个变量及相应的转移期望,一种合理的重新估计隐马尔可夫模型(HMM)的参数<img file="DEST_PATH_IMAGE178.GIF" wi="16" he="16" />,A和B方法如下:<img file="DEST_PATH_IMAGE180.GIF" wi="65" he="28" />在t=1时处在状态<img file="DEST_PATH_IMAGE182.GIF" wi="10" he="18" />的期望概率;<img file="DEST_PATH_IMAGE184.GIF" wi="101" he="89" />从状态<img file="388271DEST_PATH_IMAGE182.GIF" wi="10" he="18" />到状态<img file="DEST_PATH_IMAGE186.GIF" wi="14" he="21" />的转移期望概率除以从状态<img file="394404DEST_PATH_IMAGE182.GIF" wi="10" he="18" />转移出去的期望概率;<img file="DEST_PATH_IMAGE188.GIF" wi="173" he="89" />在状态<img file="844846DEST_PATH_IMAGE186.GIF" wi="14" he="21" />观察到<img file="DEST_PATH_IMAGE190.GIF" wi="18" he="25" />的期望概率除以处在状态<img file="303640DEST_PATH_IMAGE186.GIF" wi="14" he="21" />的期望概率;其中,<img file="553356DEST_PATH_IMAGE178.GIF" wi="16" he="16" />表示初始状态概率,A表示状态转移矩阵,B表示混淆矩阵,<img file="DEST_PATH_IMAGE192.GIF" wi="20" he="28" />表示训练后更新的初始状态概率,<img file="DEST_PATH_IMAGE194.GIF" wi="21" he="29" />表示训练后更新的由状态i转移到状态j的概率,<img file="DEST_PATH_IMAGE196.GIF" wi="38" he="29" />表示训练后更新的在状态j下观察到k的概率;通过上述的训练可以得到描述本次训练状态的模型的参数<img file="DEST_PATH_IMAGE198.GIF" wi="60" he="26" />;步骤五:健康状态监测,具体是:此过程主要涉及到HMM三个问题中的评估问题,采取前向算法则可以解决这一问题;前向算法定义t时刻状态j的局部概率为<img file="DEST_PATH_IMAGE200.GIF" wi="40" he="25" />=Pr(观察状态|隐藏状态j)<img file="DEST_PATH_IMAGE202.GIF" wi="13" he="14" />Pr(t时刻所有指向状态j的路径),对于最后的状态,其局部概率包括了通过所有可能的路径到达这些状态的概率;特别当t=1时,没有任何指向当前状态的路径;故t=1时位于当前状态的概率是初始概率,即Pr(state|t=1)=P(state),因此,t=1时的局部概率<img file="DEST_PATH_IMAGE204.GIF" wi="36" he="25" />等于当前状态的初始概率乘以相关的观察概率:<img file="DEST_PATH_IMAGE206.GIF" wi="108" he="25" />计算t&gt;1时的局部概率<img file="DEST_PATH_IMAGE208.GIF" wi="30" he="20" />;t-1时刻<img file="218256DEST_PATH_IMAGE208.GIF" wi="30" he="20" />给出了所有到达此t时刻状态的前一路径概率,因此,可以通过t-1时刻的局部概率定义t时刻的<img file="341064DEST_PATH_IMAGE208.GIF" wi="30" he="20" />:<img file="DEST_PATH_IMAGE210.GIF" wi="168" he="46" />可以递归地计算给定隐马尔科夫模型后一个观察序列的概率,即通过t=1时刻的局部概率<img file="474105DEST_PATH_IMAGE208.GIF" wi="30" he="20" />计算t=2时刻的<img file="839096DEST_PATH_IMAGE208.GIF" wi="30" he="20" />,通过t=2时刻的<img file="741193DEST_PATH_IMAGE208.GIF" wi="30" he="20" />计算t=3时刻的<img file="221853DEST_PATH_IMAGE208.GIF" wi="30" he="20" />等等直到t=T;给定隐马尔科夫模型的观察序列的概率就等于t=T时刻的局部概率之和;使用前向算法计算T时长的观察序列的概率:已知T时长观察序列:<img file="DEST_PATH_IMAGE212.GIF" wi="96" he="25" />1)t=1时刻所有状态的局部概率<img file="389660DEST_PATH_IMAGE062.GIF" wi="17" he="16" />:<img file="DEST_PATH_IMAGE214.GIF" wi="122" he="26" />2)在t=2,……T时,对于每个状态的局部概率,由下式计算:<img file="DEST_PATH_IMAGE216.GIF" wi="166" he="47" />3) 最后,给定HMM,观察序列的概率等于T时刻所有局部概率之和:<img file="DEST_PATH_IMAGE218.GIF" wi="116" he="46" />;使用者每次使用Wii 平衡板都将产生训练数据,同时使用此数据训练出一个HMM模型,并计算此数据在上次获取的HMM模型下产生的概率,如果前后两次的数据产生概率值小于动态的更新因子,则保留此数据产生概率值和此次的HMM模型,不断的重复这个过程,将会获取更加精细的变化范围,缩小的变化范围将能更加准确的去判断每次使用平衡板产生数据的异常状态,同时将获取逐渐趋近于正常事件先验知识的HMM模型,反之,则代表着使用者的健康状态发生了变化,可以记录本次异常,同时舍弃本次的数据产生概率值和HMM模型;不断的重复这个过程,就到达了边训练边监测,边训练边优化的目的。
地址 310018 浙江省杭州市下沙高教园区2号大街