联系人:
所在地:
本发明公开了一种结合深度Q学习的机器人路径学习与避障系统及方法。本发明包括动作模块、学习模块和障碍物避险模块。在路径规划期间,动作模块会从学习模块和障碍物避险模块接收指令,并让机器人根据指令完成指定动作。学习模块根据机器人当前状态和动作的历史数据序列,训练动作选择策略。障碍物避险模块执行随机树搜索算法,以指导机器人从危险情况避险得到安全路径。每个模块在执行后,环境中机器人的当前状态都将发生变化。通过安排机制评估每个模块的风险并确定应激活风险最小的模块。本发明使用Q学习算法解决了大容量数据存储的问题。提高了机器人在避开障碍物时的效率问题。