发明名称 一种室内移动机器人增强地图学路径规划方法
摘要 本发明公开了一种室内移动机器人增强地图学路径规划方法,其步骤为:(1)获取周围环境信息,建立障碍概率密度模型;(2)利用贪心算法和增强地图学方法进行路径规划;(3)室内移动机器人路径选择及自适应速度调整策略。采用的增强地图学路径规划能够根据室内移动机器人的当前状况和机器人固有的非完整约束,实时规划当前最佳路径,同时自适应的速度调整策略可以兼顾室内移动机器人的越障能力,目标点收敛能力和规划效率,使室内移动机器人能够安全有效的到达指定位置。
申请公布号 CN104298239A 申请公布日期 2015.01.21
申请号 CN201410512492.2 申请日期 2014.09.29
申请人 湖南大学 发明人 王耀南;陈彦杰;钟杭;潘琪
分类号 G05D1/02(2006.01)I;G05B13/04(2006.01)I 主分类号 G05D1/02(2006.01)I
代理机构 长沙市融智专利事务所 43114 代理人 黄美成
主权项 一种室内移动机器人增强地图学习路径规划方法,其特征在于,包括以下几个步骤:步骤1:建立已探测区域受障碍物影响的概率模型;首先,通过室内移动机器人自身携带的声呐传感器,获得室内移动机器人的周围环境信息;其次,将室内移动机器人所经过的区域作为已探测区域,依据所述的周围环境信息建立已探测区域受障碍物影响的概率模型,并依据声呐传感器实时采集的周围环境信息实时更新已探测区域受障碍物影响的概率模型;所述已探测区域受障碍物影响的概率模型如下:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>F</mi><mrow><mo>(</mo><mi>X</mi><mo>,</mo><mi>Y</mi><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>-</mo><munderover><mi>&Pi;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><mo>[</mo><mn>1</mn><mo>-</mo><msub><mi>f</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>X</mi><mo>,</mo><mi>Y</mi><mo>)</mo></mrow><mo>]</mo></mrow>]]></math><img file="FDA0000580228260000011.GIF" wi="638" he="150" /></maths>其中,室内移动机器人工作空间信息集合为<img file="FDA0000580228260000012.GIF" wi="94" he="60" />所述空间信息包括所有目标位置及所有障碍物位置;当前探测范围内工作空间信息集合为<img file="FDA0000580228260000013.GIF" wi="129" he="74" />已探测出的工作空间信息集合为<img file="FDA0000580228260000014.GIF" wi="644" he="70" />{(X,Y)}为已探测区域,<img file="FDA0000580228260000015.GIF" wi="729" he="76" />在<img file="FDA0000580228260000016.GIF" wi="214" he="65" />的地图上探测到有M个障碍物,f<sub>i</sub>(X,Y)为第i个障碍物的对室内移动机器人路径选择的影响函数,采用正态分布表示如下:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>f</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>X</mi><mo>,</mo><mi>Y</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><msqrt><mn>2</mn><mi>&pi;</mi></msqrt><msub><mi>&sigma;</mi><mi>i</mi></msub></mrow></mfrac><msup><mi>e</mi><mrow><mo>(</mo><mo>-</mo><mfrac><msup><msub><mi>D</mi><mi>i</mi></msub><mn>2</mn></msup><msub><mrow><mn>2</mn><mi>&sigma;</mi></mrow><mi>i</mi></msub></mfrac><mo>)</mo></mrow></msup></mrow>]]></math><img file="FDA0000580228260000017.GIF" wi="511" he="171" /></maths>其中,σ<sub>i</sub>为第i个障碍物的影响范围系数,取值范围为[0,1];D<sub>i</sub>为第i个障碍物到已探测区域内所有位置的距离矩阵,矩阵大小与地图大小一致为N*N;步骤2:基于贪心算法和增强学习迭代策略,在设定的最大迭代次数k<sub>max</sub>内,迭代更新当前位置p<sub>now(t)</sub>与目标位置p<sub>goal</sub>之间的路径代价函数,以达到收敛的路径代价函数对应的路径作为当前时刻的最佳路径,具体过程如下:步骤2.1:令k=1,k表示迭代次数;步骤2.2:判断当前迭代次数是否已超过设定的最大迭代次数,若超过,则返回步骤2.1,;否则,进入步骤2.3;步骤2.3:从获得的周围环境信息对应的已知地图中,随机选择一个位置p<sub>k</sub>插入室内移动机器人所在当前位置p<sub>now(t)</sub>与目标位置p<sub>goal</sub>,其中,p<sub>k</sub>满足条件<img file="FDA0000580228260000018.GIF" wi="427" he="77" />{p<sub>r</sub>}为之前迭代最佳路径代价函数下的路径点集合,<img file="FDA0000580228260000021.GIF" wi="58" he="60" />为室内移动机器人工作空间信息集合;按以下公式计算第k次迭代得到的路径代价函数<img file="FDA0000580228260000022.GIF" wi="160" he="92" /><img file="FDA0000580228260000023.GIF" wi="750" he="93" />其中,<img file="FDA0000580228260000024.GIF" wi="137" he="92" />第k‑1次迭代得到的路径代价函数,且<img file="FDA0000580228260000025.GIF" wi="554" he="94" /><img file="FDA00005802282600000215.GIF" wi="164" he="68" />为已知地图上当前位置p<sub>now(t)</sub>与所选位置p<sub>k</sub>之间的连接权值,<img file="FDA0000580228260000026.GIF" wi="74" he="87" />为采用贪心算法获得的在第k次迭代完成后获得的从位置p<sub>k</sub>到目标位置p<sub>goal</sub>的最佳路径代价函数:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msubsup><mi>G</mi><mi>p</mi><mi>k</mi></msubsup><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><msub><mi>R</mi><mrow><msub><mi>p</mi><mi>k</mi></msub><mo>,</mo><msub><mi>p</mi><mi>goal</mi></msub></mrow></msub><mo>+</mo><msub><mi>G</mi><msub><mi>p</mi><mi>goal</mi></msub></msub></mtd><mtd><mi>k</mi><mo>=</mo><mn>1</mn></mtd></mtr><mtr><mtd><mi>min</mi><mo>{</mo><msub><mi>R</mi><mrow><msub><mi>p</mi><mi>k</mi></msub><mo>,</mo><msub><mi>p</mi><mi>goal</mi></msub></mrow></msub><mo>+</mo><msub><mi>G</mi><msub><mi>p</mi><mi>goal</mi></msub></msub><mo>,</mo><msub><mi>R</mi><mrow><msub><mi>p</mi><mi>k</mi></msub><mo>,</mo><msub><mi>p</mi><mrow><mi>k</mi><mo>-</mo><mn>1</mn></mrow></msub></mrow></msub><mo>+</mo><msubsup><mi>G</mi><mi>p</mi><mrow><mi>k</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mo>}</mo></mtd><mtd><mi>k</mi><mo>&NotEqual;</mo><mn>1</mn></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000580228260000027.GIF" wi="987" he="179" /></maths>其中,<img file="FDA0000580228260000028.GIF" wi="111" he="81" />为目标位置p<sub>goal</sub>的代价函数,且<img file="FDA0000580228260000029.GIF" wi="222" he="86" /><img file="FDA00005802282600000210.GIF" wi="143" he="77" />为已知地图上在第k次所选位置点p<sub>k</sub>和第k‑1次所选位置p<sub>k‑1</sub>之间的连接权值;在已知地图中任意两位置p<sub>a</sub>和p<sub>b</sub>之间的连接权值<img file="FDA00005802282600000216.GIF" wi="111" he="68" />由两位置之间的直线距离和该直线上穿过的障碍物影响概率构成:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>R</mi><mrow><msub><mi>p</mi><mi>a</mi></msub><mo>,</mo><msub><mi>p</mi><mi>b</mi></msub></mrow></msub><mo>=</mo><msub><mi>d</mi><mrow><msub><mi>p</mi><mi>a</mi></msub><mo>,</mo><msub><mi>p</mi><mi>b</mi></msub></mrow></msub><mo>+</mo><mi>max</mi><mrow><mo>(</mo><munder><mo>&Integral;</mo><msub><mi>C</mi><mrow><msub><mi>p</mi><mi>a</mi></msub><mo>,</mo><msub><mi>p</mi><mi>b</mi></msub></mrow></msub></munder><mi>F</mi><mrow><mo>(</mo><mi>X</mi><mo>,</mo><mi>Y</mi><mo>)</mo></mrow><mi>ds</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA00005802282600000211.GIF" wi="748" he="192" /></maths>其中,<img file="FDA00005802282600000212.GIF" wi="123" he="77" />为位置p<sub>a</sub>到位置p<sub>b</sub>两点之间的物理位置距离;<img file="FDA00005802282600000213.GIF" wi="125" he="78" />为位置p<sub>a</sub>到位置p<sub>b</sub>的路径点集合,ds为路径积分单元;max()为最大值求函数;步骤2.4:判断迭代后得到的路径代价函数<img file="FDA00005802282600000214.GIF" wi="135" he="94" />是否已经达到收敛,如果收敛,则退出迭代过程,将已收敛的路径代价函数对应的路径作为最佳路径进入步骤3;否则,将迭代次数k加1,返回步骤2.2;步骤3:以步骤2得到的最佳路径作为室内移动机器人当前的预选择路径,依据预选择路径和室内移动机器人的位置和速度矢量判断室内移动机器人的偏转角φ<sub>t</sub>是否满足轮式机器人不能侧向滑动的非完整约束,确定室内移动机器人是否按照预选择路径方向移动:若不满足,则返回步骤2;若满足则以设定的室内移动机器人移动速度沿当前时刻规划出的最佳路径方向移动,进入下一时刻的路径规划,t=t+1,返回步骤1,直到室内移动机器人移动到目标位置,完成路径规划;所述室内移动机器人的偏转角φ<sub>t</sub>是否满足轮式机器人不能侧向滑动的非完整约束是指:φ<sub>t</sub>∈[0,60°]∪[120°,180°];其中,<img file="FDA0000580228260000031.GIF" wi="954" he="166" />p<sub>t</sub>和p<sub>t‑1</sub>分别为室内移动机器人当前位置和上一时刻所在位置,<img file="FDA0000580228260000032.GIF" wi="88" he="75" />为在t时刻,室内移动机器人由规划得到的最佳路径中第一个路径点,即室内移动机器人在t+1时刻的预抵达位置;p<sub>t‑1</sub>由p<sub>t‑1</sub>=p<sub>t</sub>‑vt得到,v为设定的室内移动机器人移动速度。
地址 410082 湖南省长沙市岳麓区麓山南路2号