发明名称 基于扩展式合作博弈的多机器人围捕目标方法
摘要 本发明提供一种基于扩展式合作博弈的多机器人围捕目标方法,包括如下步骤:步骤一:对多机器人围捕的扩展式合作博弈模型进行数学建模;步骤二:制定机器人的运行策略;步骤三:围捕任务执行过程的制定;本发明使得围捕机器人在执行任务过程中可以有更加灵活的位置,它们可以快速的追赶目标,追赶过程中可以躲避障碍物和同伴,最后围堵在目标机器人周围,使得目标机器人无法从包围圈中逃脱。
申请公布号 CN104942807A 申请公布日期 2015.09.30
申请号 CN201510178542.2 申请日期 2015.04.16
申请人 上海大学 发明人 李敏;李洋;窦连航
分类号 B25J9/16(2006.01)I;G06F19/00(2011.01)I;G06F17/50(2006.01)I 主分类号 B25J9/16(2006.01)I
代理机构 上海上大专利事务所(普通合伙) 31205 代理人 陆聪明
主权项 一种基于扩展式合作博弈的多机器人围捕目标方法, 其特征在于,具体包括如下步骤:步骤一:对多机器人围捕的扩展式合作博弈模型进行数学建模:围捕机器人:多机器人群体协作系统中机器人集合为:<img file="dest_path_image001.GIF" wi="227" he="19" />;<img file="515311dest_path_image002.GIF" wi="48" he="19" />表示的是系统中的围捕机器人i;目标机器人只有一个为<i>Target</i>;行动集:轮到<img file="dest_path_image003.GIF" wi="48" he="19" />行动时,可以选择的所有行动的集合被称为行动集,记为<img file="515496dest_path_image004.GIF" wi="44" he="19" />;通过对本发明行动策略的分析和简化得到以下的行动集:<img file="13474dest_path_image006.GIF" wi="141" he="21" />TT 策略表示围捕机器人朝目标机器人方向运动一步;TL策略表示围捕机器人沿左侧最小避碰方向角<img file="dest_path_image007.GIF" wi="17" he="19" />运动一步;TR策略表示围捕机器人沿右侧最小避碰方向角<img file="519542dest_path_image007.GIF" wi="17" he="18" />运动一步;策略集Move中的策略分别指朝目标机器人左侧、右侧方向运动和朝目标机器人方向运动;<img file="939022dest_path_image008.GIF" wi="21" he="23" />是具有较高碰撞危险度的机器人<img file="821527dest_path_image002.GIF" wi="48" he="18" />和<img file="dest_path_image009.GIF" wi="49" he="21" />之间的最小避碰方向角,<img file="174011dest_path_image010.GIF" wi="68" he="19" />与<img file="dest_path_image011.GIF" wi="69" he="21" />为最小避碰距离,<img file="804975dest_path_image012.GIF" wi="73" he="21" />代表机器人<img file="242909dest_path_image002.GIF" wi="48" he="18" />和<img file="663526dest_path_image009.GIF" wi="49" he="21" />之间的距离;<img file="136096dest_path_image008.GIF" wi="21" he="22" />公式表示为:<img file="656070dest_path_image014.GIF" wi="336" he="62" />围捕者运动方向与环境x轴的夹角为<img file="dest_path_image015.GIF" wi="15" he="19" />,此为围捕者的运动方向角;那么可以得到三种运动策略的运动公式如下:<i>TT</i><i>:<img file="581301dest_path_image016.GIF" wi="63" he="21" /></i><i>TL</i><i>:<img file="dest_path_image017.GIF" wi="101" he="24" /></i><i>TR</i><i>:<img file="258139dest_path_image018.GIF" wi="103" he="24" /></i>阶段和行动顺序:在扩展式合作博弈中,围捕者是按照一定的规则按照顺序进行运动,每次运动称为一个阶段;本发明要求每个阶段仅有一个围捕者进行运动,因此阶段数是由参与博弈的围捕者的数量决定;围捕机器人运行角度的计算方法:a、b、c分别为围捕者、目标前一位置和现在位置组成三角形的三个边,围捕者与目标的连线是围捕者此时的运动方向<img file="dest_path_image019.GIF" wi="16" he="19" />,计算公式为如下:<img file="dest_path_image021.GIF" wi="291" he="21" />围捕者与目标之间的距离为<img file="585215dest_path_image022.GIF" wi="68" he="17" />,<img file="dest_path_image023.GIF" wi="47" he="19" />为目标的坐标位置,(<img file="541669dest_path_image024.GIF" wi="32" he="16" />)为围捕者坐标位置,<img file="dest_path_image025.GIF" wi="65" he="21" />的计算公式为:<img file="dest_path_image027.GIF" wi="251" he="42" />综上所述,约定局中人博弈优先级顺序<img file="954196dest_path_image028.GIF" wi="71" he="20" />为如下三式:<img file="716616dest_path_image030.GIF" wi="296" he="42" /><img file="849264dest_path_image032.GIF" wi="299" he="42" /><img file="304516dest_path_image034.GIF" wi="222" he="42" />式中<img file="dest_path_image035.GIF" wi="17" he="23" />,<img file="204339dest_path_image036.GIF" wi="103" he="22" />和<img file="dest_path_image037.GIF" wi="48" he="24" />分别为机器人<img file="708132dest_path_image002.GIF" wi="48" he="21" />的任务、与目标的相对距离和目标角对博弈优先级的影响函数,<img file="744221dest_path_image038.GIF" wi="17" he="18" />表示机器人到达目标的有效区域半径,<img file="dest_path_image039.GIF" wi="19" he="16" />为每一项的权值系数,且<img file="370375dest_path_image040.GIF" wi="177" he="18" />;收益函数:在扩展式博弈中,博弈机器人的收益函数是所有个体共用的;在围捕机器人各自采取某种行为策略后,就形成一个局势,所以为了衡量局势的优劣,本发明采用局势评估函数作为收益函数,计算出的评估值作为围捕机器人的收益值;为了描述一个局势对围捕机器人完成目标的贡献大小, 步骤二:制定机器人的运行策略:搜索目标机器人策略: 任务初始,如果围捕机器人无法发现目标机器人的位置,此时他们需要进行目标机器人的搜索;目标机器人的扫描范围也是有限的,在没有发现围捕者的情况下,所有的围捕机器人进行漫无目的的行走,围捕机器人之间不进行通信以减少负担,一旦有一个围捕机器人扫描到了目标机器人,不断的用最大的速度来追捕目标机器人,与此同时此围捕机器人会马上发出信号,发送目标机器人的位置信息给其扫描范围之内的围捕机器人,收到信息的围捕机器人也会用最大的速度去追捕目标机器人,并且也会发出目标机器人的位置信息给其他的围捕机器人,最后所有收到目标机器人位置信息的围捕机器人会执行围捕任务;判定围捕任务成功完成:由收益函数得知,围捕机器人在不发生碰撞的情况下,与目标机器人的距离越近收益越大,同时与其他围捕机器人距离越远其收益越大,但是由于是围捕任务,靠近目标比围捕机器人之间的距离更重要,所以在收益函数中靠近目标的收益权值比围捕机器人之间距离权值大,所以围捕机器人优先靠近目标机器人的情况下,再与其他围捕机器人保持最大的安全距离;当围捕机器人群体对目标形成围捕之后,群体几乎是均匀的分配在目标机器人周围;这样就会产生一个问题:围捕机器人群体较少时,相邻机器人之间的距离较大,容许目标机器人安全通过,造成无法完成围捕任务的情况;目标机器人逃脱策略:围捕机器人到达危险区域后,离目标机器人越近的围捕机器人对其影响越大,围捕机器人对目标影响力相加得到矢量<img file="dest_path_image041.GIF" wi="28" he="24" />,即为目标此时的运动方向;所以目标机器人的逃脱方向的计算公式为如下式:<img file="dest_path_image043.GIF" wi="246" he="62" /><img file="678865dest_path_image044.GIF" wi="16" he="22" />是指<img file="783087dest_path_image002.GIF" wi="48" he="19" />运动方向的矢量;<img file="dest_path_image045.GIF" wi="177" he="20" />是指<img file="142525dest_path_image002.GIF" wi="48" he="18" />与<i>Target</i>的距离;步骤三:围捕任务执行过程的制定:机器人分为围捕者与目标,围捕机器人有三个以上的机器人,目标只有一个机器人,所有的机器人都是同构机器人,以方便运行过程中的计算;围捕者快速的靠近目标,然后均匀的围住目标,将目标限制在围捕者组成的圈内,限制目标的运动;整个围捕过程为: 在一个平面空间中随机的产生n个围捕机器人,开始搜寻空间中的目标机器人;机器人的位置信息都是公开化的,围捕机器人根据位置信息和其他围捕机器人的运动方向来确定围捕队伍中动态博弈的顺序;根据动态博弈的顺序,围捕机器人开始了与其他机器人个体的博弈,最终确定自身的运动策略;目标机器人根据围捕机器人的位置信息确定危险情况而选择自身的运动策略;如果目标机器人围捕成功,便将目标押送到相应位置,如果围捕不成功,再次从开始制定围捕运动策略。
地址 200444 上海市宝山区上大路99号
您可能感兴趣的专利