基于Agent技术的对抗行为建模仿真平台及仿真方法,申请号CN201010279605.0-传众专利搜索

发明名称	基于Agent技术的对抗行为建模仿真平台及仿真方法
摘要	本发明提出一种基于Agent技术的对抗行为建模仿真平台及仿真方法，所述的仿真平台包括平台交互界面模块、战场环境模块、作战人员Agent行为建模模块、指挥协作Agent模块、通讯模块和评估模块。该仿真平台在逼真的战场环境支持下，通过局部协作与整体协作，可以演示和验证多Agent联合作战能力，从而研究和发展新的作战方式和方法，提高联合作战能力，且Agent个体通过行为建模具备不同个性，可模拟真实作战个体在不同战场态势下的自身的心智活动与行为决策反映，从而使作战对抗仿真过程更具真实性和智能型，提高了虚拟模拟战场作战建模行为的智能性、自主性和差异性。
申请公布号	CN101964019A	申请公布日期	2011.02.02
申请号	CN201010279605.0	申请日期	2010.09.10
申请人	北京航空航天大学	发明人	王青;吴振东;杨飞;董朝阳;解志君;黄喜元
分类号	G06F19/00(2006.01)I;G06N3/08(2006.01)I;G09B9/00(2006.01)I	主分类号	G06F19/00(2006.01)I
代理机构	北京永创新实专利事务所 11121	代理人	官汉增
主权项	1.一种基于Agent技术的对抗行为建模仿真平台，其特征在于：包括平台交互界面模块、战场环境模块、作战人员Agent行为建模模块、指挥协作Agent模块、通讯模块和评估模块；所述的平台交互界面模块包括参数设置对话框、仿真实时动画显示界面、状态参数显示对话框和评估指标输出界面；操作员通过参数设置对话框设置初始参数，包括战场实际环境参数、己方和敌方人员参数、武器装备参数、仿真次数和评估指标参数，并将该初始参数通过通讯模块发送到战场环境模块；仿真实时动画显示界面将仿真过程中对抗双方作战行为进行实时显示，仿真过程完成后，状态参数显示对话框选择性输出仿真过程中的结果状态信息，评估指标输出界面选择性输出单一指标和综合指标；所述的战场环境模块包括战场参数线程接口单元、解释单元、战场仿真单元和属性参数单元，所述的战场参数线程接口单元读取平台交互界面模块向其发送的初始参数，通过解释单元将初始参数解析为虚拟战场中的战场环境参数；战场仿真单元通过判定战场环境参数，设定执行标记因子为1或0，来选择执行或结束仿真过程；当战场仿真单元的执行标记因子设定为1时，属性参数单元利用战场环境参数解析获得战场属性参数，并将战场属性参数和战场环境参数通过通讯模块发送给作战人员Agent行为建模模块；当战场仿真单元的执行标记因子设定为0时，战场环境参数不再变化，本次仿真过程结束，战场仿真单元获得结果状态信息，根据设置的初始参数中的仿真次数的不同，进行如下动作：A：仿真为单次仿真时，将结果状态信息通过通讯模块传递给平台交互界面模块进行显示；B：仿真为多次仿真时，将每次仿真结束后的结果状态信息通过通讯模块传递给评估模块，并判定仿真次数是否达到预设的多次仿真次数，当没有达到多次仿真次数时，战场环境模块重新读取初始参数，并将执行标记因子设定为1，进行下次仿真，直至执行仿真次数达到设定的多次仿真次数，战场仿真单元结束多次仿真全过程，并将每次仿真过程的单一指标和综合指标通过通讯模块传递到平台交互界面的评估指标输出界面进行输出；所述的作战人员Agent行为建模模块包括态势感知结构、决策规划结构、个人主观结构和外在行为输出结构；所述的态势感知结构接收通讯模块发送的战场环境参数和战场属性参数，生成观察因素感知模式集，计算观察因素量化值以及分析量化值的可信度，合并观察因素量化值以及量化值的可信度形成当前的态势信念，具体的实现过程如下：A：观察因素感知模式集生成：态势感知结构通过通讯模块获取战场环境参数和战场属性参数，生成观察因素感知模式集Ss；B：计算观察因素量化值：设战场环境的观察因素中第i观察因素的预设模式和感知模式分别是<img file="FSA00000266788700021.GIF" wi="491" he="60" />和<img file="FSA00000266788700022.GIF" wi="502" he="58" />其中，<img file="FSA00000266788700023.GIF" wi="354" he="48" />E<sub>out</sub>是作战人员预设观察因素感知集，S<sub>s</sub>为观察因素感知模式集，p<sub>i1</sub>～p<sub>in</sub>与q<sub>i1</sub>～q<sub>in</sub>是第i观察因素的预设模式和感知模式的特征量，n为第i观察因素的预设模式和感知模式的特征量的数量，由第i观察因素具体决定，观察因素中第i观察因素的量化值v<sub>i</sub>定义为：<img file="FSA00000266788700024.GIF" wi="566" he="110" />其中，p<sub>ik</sub>和q<sub>ik</sub>是第i观察因素的预设模式和感知模式的特征量中对应值，w<sub>k</sub>为加权系数，满足0＜w<sub>k</sub>＜1，k＝1，2，3，…，n及w<sub>1</sub>+w<sub>2</sub>+…+w<sub>n</sub>＝1，0＜v<sub>i</sub>≤1；C：量化值的可信度分析：态势感知结构的态势信念产生依赖于观察因素感知模式集S<sub>s</sub>中的观察因素量化值的可信度m，可信度m定义为：<img file="FSA00000266788700025.GIF" wi="259" he="116" />n≥1，k<sub>i</sub>满足k<sub>1</sub>+k<sub>2</sub>+…+k<sub>n</sub>＝n，且k<sub>1</sub>，k<sub>2</sub>，…，k<sub>n</sub>＞0，集合<img file="FSA00000266788700026.GIF" wi="226" he="63" />是相互影响的观察因素感知模式集合，k<sub>i</sub>的取值与<img file="FSA00000266788700027.GIF" wi="30" he="45" />相关；D：形成当前态势信念：综合观察因素量化值和量化值的可信度生成观察因素量化集合，将此集合与先验态势信念作证据合并，计算获得当前的态势信念；所述的个人主观结构收到态势感知结构传递的感知模式集S<sub>s</sub>中的主观因素，将这些主观因素利用个人主观结构中的规则库和自学习系统综合后，生成主观综合指标，并传递到决策规划结构中；个人主观结构中的自学习系统采用学习速率快的RBF神经网络，网络的输入层由获得的主观因素构成，每个输入量根据当前主观因素的权值比例取值，网络的输出量是主观综合指标p<sub>i</sub>；网络逼近权值的训练依赖于战场态势和任务输入输出数据，得出战场中各种主观因素可求取的主观综合指标；所述的决策规划结构读取态势感知结构当前的态势信念和个人主观结构的主观综合指标构造决策任务，运用决策准则选出当前决策规则的方案，并依据规则方案形成相应的战术行为意图；决策规划结构首先进行状态属性判断，然后进行决策规则的选择，最后依据决策规则形成对应的战术行为意图，并将战术行为意图发送到外在行为输出结构，具体实现流程如下：A：状态属性判断状态属性判断包括作战人员Agent的生存状态、作战人员Agent的人员态势和作战人员Agent的个性状态的判断；B：决策规则根据作战人员Agent的状态属性，运用决策规则能达到既定任务，决策规则由阈值判断，阈值是由作战人员Agent的状态属性来动态设置；设计的决策规则有前进规则、聚集规则、作战规则、撤离规则和优先级作战规则；C：形成战术行为意图；决策规划结构根据决策规则生成战术行为意图，包括机动意图和作战意图；所述的前进规则、聚集规则和撤离规则生成机动意图，所述的作战规则和优先级作战规则生成作战意图，机动意图和作战意图通过通讯模块发送到外在行为输出结构；所述的外在行为输出结构获取决策规划结构发送的战术行为意图，生成确定的可执行外在行为，实现作战人员Agent动作反应的自主性和逼真性；引入战术动作的收益值确定其执行的频率，在外在行为输出结构中设定概率因子P(Ac<sub>i</sub>\|d)，作战行为被赋予执行的概率因子描述为：<img file="FSA00000266788700031.GIF" wi="586" he="106" />其中，P(Ac<sub>i</sub>\|d)表示作战人员行为的动作意图d条件下选择动作Ac<sub>i</sub>的概率，<img file="FSA00000266788700032.GIF" wi="220" he="61" />表示选择执行动作的收益值，k值越大，表明赋予某个动作的概率越大，l≥1，表示作战人员在动作意图d条件下可以选择的动作总数；所述的可执行外在行为使战场环境变化，战场环境模块通过通讯模块实时获取战场环境信息，重新解析战场属性参数，得到结果状态信息，当仿真系统进行单次仿真时，如果仿真过程经战场环境模块判定完成，则结果状态信息通过通信模块传递给平台交互界面模块进行输出，当仿真系统进行多次仿真时，每一次仿真过程结束时，结果状态信息通过通讯模块传递到评估模块进行评估；所述的指挥协作Agent模块包括态势参数接口、态势参数缓存区和协作模式设定单元；所述的态势参数接口接收通讯模块发送的战场环境参数和战场属性参数，态势参数缓存区缓存通讯模块发来的战场环境参数和战场属性参数，协作模式设定单元依据态势参数接口接收到的战场环境参数和战场属性参数，选定整体协作和局部协作；整体协作通过多个局部协作组合完成，整体协作与作战人员Agent的实体类型和战场的部署态势有关；所述的通讯模块用于完成战场环境模块设置，以及战场环境模块、作战人员Agent行为建模模块和指挥协作Agent模块的之间信息交互传递；通讯模块采用Agent通信语言FIPA-ACL描述战场环境模块、作战人员Agent行为建模模块和指挥协作Agent模块之间的信息协议的交互，并定义规范互操作语言及完整的语法定义结构；所述的评估模块是仿真平台的输出后处理模块，包括状态参数读取单元、单一指标值统计单元、效果测度计算单元和综合指标统计单元；当平台交互界面模块设置的仿真为多次仿真，状态参数读取单元通过通讯模块读取结果状态信息，将该结果状态信息传递给单一指标值统计单元进行单一指标计算，同时该结果状态信息还通过效果测度计算单元计算效果测度，将效果测度传递给综合指标统计单元进行综合指标计算，多次仿真的仿真过程全部结束后，单一指标和综合指标通过通讯模块输入到平台交互界面模块，以曲线或表格的形式输出到评估指标输出界面。
地址	100191 北京市海淀区学院路37号