题名 | 一种基于规则迭代的无人车自学习控制方法 |
作者 | 张力夫 |
答辩日期 | 2021-05-27 |
文献子类 | 硕士 |
授予单位 | 中国科学院大学 |
授予地点 | 中国科学院自动化研究所 |
导师 | 汤淑明 |
关键词 | 无人车控制 自主学习 规则提取 规则迭代 |
学位名称 | 工程硕士 |
学位专业 | 控制工程 |
英文摘要 | 近年来,无人驾驶引起社会的广泛关注。无人驾驶技术对改善城市交通和环境友好持续发展具有重要意义,同时还能提升驾驶安全性,有效降低事故发生率。无人车运动控制是无人驾驶领域不可或缺的关键技术之一。与传统的分为感知、认知、决策和控制的无人驾驶技术方案不同,AlphaGo Zero的出现为人们对机器自学习能力的研究树立了新的范式,本文借鉴人类学习驾驶技术的渐进过程,开展基于规则迭代的无人车自学习控制方法的研究,让无人车控制器能够通过自学习从完全不具备行驶能力,逐步达到具备安全平稳顺滑的行驶能力。 本文基于深度强化学习方法,通过规则提取以及奖励规则迭代的方式,模拟人类学习驾驶车辆的渐进过程,在仿真环境下实现无人车安全平稳行驶,具体研究内容包括: (1)搭建Carla无人驾驶仿真平台,针对城镇道路环境下无人车运动控制任务进行仿真实验,验证DQN和DDPG两类典型深度强化学习算法的性能。 (2)全面分析典型城镇道路环境下车辆行驶任务,根据交通规则、道路边界条件等类比人类学习驾驶行为,给出一套分级驾驶任务规则,并转化为学习算法中相应的奖惩规则。 (3)基于获得的奖惩规则对DDPG算法的奖励函数部分提出改进,并优化了DDPG算法的状态空间。实验结果表明,提出方法有效提升了无人车控制器的平稳性和算法的训练效率,车辆的行驶任务平均完成度接近90%,且训练时间明显缩短,与原DQN和DDPG深度强化学习的训练结果相比有显著提升。 |
语种 | 中文 |
页码 | 84 |
内容类型 | 学位论文 |
源URL | [http://ir.ia.ac.cn/handle/173211/44990] ![]() |
专题 | 自动化研究所_智能制造技术与系统研究中心 |
推荐引用方式 GB/T 7714 | 张力夫. 一种基于规则迭代的无人车自学习控制方法[D]. 中国科学院自动化研究所. 中国科学院大学. 2021. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论