发明名称 |
用于计算机辅助地学对技术系统的控制和/或调节的方法 |
摘要 |
本发明涉及一种用于计算机辅助地学对技术系统的控制和/或调节的方法,其中该技术系统的运行由该技术系统在运行中可以采取的状态以及在该技术系统的运行期间可以被执行并且将该系统的相应状态转变成后继状态的动作来表征。在根据本发明的方法中,在学对该技术系统的控制时适当地考虑在学时所使用的训练数据的统计不确定性。这通过如下方式进行:借助于不确定性传播确定对该技术系统的优化运行进行建模的质量函数的统计不确定性,并且在学动作选择规则时将其引入。在此,根据本发明的方法的特征在于,所述不确定性传播使用非对角元素被忽略的协方差矩阵。通过该近似,该方法变得计算效率非常高,并且在执行时需要小的存储空间需求。 |
申请公布号 |
CN102023570A |
申请公布日期 |
2011.04.20 |
申请号 |
CN201010279903.X |
申请日期 |
2010.09.09 |
申请人 |
西门子公司 |
发明人 |
A·汉斯;S·乌德卢夫特 |
分类号 |
G05B13/04(2006.01)I |
主分类号 |
G05B13/04(2006.01)I |
代理机构 |
中国专利代理(香港)有限公司 72001 |
代理人 |
张涛;李家麟 |
主权项 |
1.一种用于计算机辅助地学习对技术系统进行控制或调节的方法,其中该技术系统的运行由该技术系统在运行中能够采取的状态(s)以及在该技术系统的运行期间被执行并且将该系统的相应状态(s)转变为后继状态的动作来表征,其中-基于在该技术系统的运行中所检测的包括状态(s)、动作(a)和后继状态(s′)的训练数据来学习质量函数(Q)和动作选择规则(∏(S)),其中质量函数(Q)对该技术系统的优化运行进行建模,并且动作选择规则(∏(S))在该技术系统运行时针对该技术系统的相应状态(s)说明要优选执行的一个或多个动作(a);-在学习质量函数(Q)和动作选择规则(∏(S))期间,借助于不确定性传播来确定质量函数(Q)的统计不确定性的度量<img file="FSA00000267577900011.GIF" wi="190" he="69" />并且根据统计不确定性的度量<img file="FSA00000267577900012.GIF" wi="139" he="58" />以及对应于对质量函数(Q)的统计最小要求的确定性参数(ξ)来确定经过修改的质量函数,其中所述不确定性传播使用非对角元素被忽略的协方差矩阵;以及-其中基于经过修改的质量函数来学习动作选择规则(∏(S))。 |
地址 |
德国慕尼黑 |