作者
陆俊凯
文章摘要
为了更好地解决无人机在复杂动态环境中自主避障的鲁棒性与效率问题,提出一种基于改进深度强化学习的避障策略。以双延迟深度确定性策略梯度算法为基础,优化状态空间表征与奖励函数设计,引入训练机制提升模型泛化能力。通过构建三维动态仿真环境,将所提策略与传统A*算法、基础深度Q网络算法进行对比实验。结果表明,优化策略在避障成功率、路径平滑性及动态环境适应性方面均显著优于对比算法,避障成功率达98.7%,平均路径曲率降低32.1%,为无人机自主导航提供可靠技术支撑。
文章关键词
无人机;自主避障;强化学习;路径优化;深度强化学习
参考文献
[1] 王丽明,辛朝阳.基于多传感器融合的无人机自主避障技术研究[J].科技创新与应用,2025,15(34):37-40.
[2] 弭兆鹏,许富龙.城市低空环境的无人机自主避撞算法分析[J].电子技术,2025,54(09):278-279.
[3] 范弘悦.基于深度强化学习的无人机自主避障路径规划优化方法[J].中国新技术新产品,2025,(15):8-10.
Full Text:
DOI