基于策略梯度及强化学习的拖挂式移动机器人控制方法
林俊文1,程 金1*,季金胜2
(1. 济南大学 自动化与电气工程学院, 山东 济南 250024;2. 南洋理工大学 电子电气工程学院,新加坡 639798)
摘 要:针对拖挂式移动机器人的反向泊车运动控制问题,提出了一种基于策略梯度及强化学习的拖挂式移动机器人控制方法。首先,在Gym软件中搭建了具有单节拖车的拖挂式移动机器人的运动学仿真模型,并设计了稳定的反向泊车运动控制律。其次,构建了基于Tensorflow框架的神经网络模型,设计了相应的损失函数,并利用策略梯度算法更新神经网络的参数,以训练机器人的反向泊车运动。仿真实验结果表明,经过训练的拖挂式移动机器人能够有效地学习反向泊车运动控制策略,并稳定地实现反向泊车运动。不同参数下的实验结果验证了基于策略梯度算法的强化学习模型的有效性。
关键词:拖挂式移动机器人;强化学习;人工智能;策略梯度算法;反向泊车