题名一种基于规则迭代的无人车自学习控制方法
作者张力夫
答辩日期2021-05-27
文献子类硕士
授予单位中国科学院大学
授予地点中国科学院自动化研究所
导师汤淑明
关键词无人车控制 自主学习 规则提取 规则迭代
学位名称工程硕士
学位专业控制工程
英文摘要

近年来,无人驾驶引起社会的广泛关注。无人驾驶技术对改善城市交通和环境友好持续发展具有重要意义,同时还能提升驾驶安全性,有效降低事故发生率。无人车运动控制是无人驾驶领域不可或缺的关键技术之一。与传统的分为感知、认知、决策和控制的无人驾驶技术方案不同,AlphaGo Zero的出现为人们对机器自学习能力的研究树立了新的范式,本文借鉴人类学习驾驶技术的渐进过程,开展基于规则迭代的无人车自学习控制方法的研究,让无人车控制器能够通过自学习从完全不具备行驶能力,逐步达到具备安全平稳顺滑的行驶能力。

本文基于深度强化学习方法,通过规则提取以及奖励规则迭代的方式,模拟人类学习驾驶车辆的渐进过程,在仿真环境下实现无人车安全平稳行驶,具体研究内容包括:

1)搭建Carla无人驾驶仿真平台,针对城镇道路环境下无人车运动控制任务进行仿真实验,验证DQNDDPG两类典型深度强化学习算法的性能。

2)全面分析典型城镇道路环境下车辆行驶任务,根据交通规则、道路边界条件等类比人类学习驾驶行为,给出一套分级驾驶任务规则,并转化为学习算法中相应的奖惩规则。

3)基于获得的奖惩规则对DDPG算法的奖励函数部分提出改进,并优化了DDPG算法的状态空间。实验结果表明,提出方法有效提升了无人车控制器的平稳性和算法的训练效率,车辆的行驶任务平均完成度接近90%,且训练时间明显缩短,与原DQNDDPG深度强化学习的训练结果相比有显著提升。

语种中文
页码84
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/44990]  
专题自动化研究所_智能制造技术与系统研究中心
推荐引用方式
GB/T 7714
张力夫. 一种基于规则迭代的无人车自学习控制方法[D]. 中国科学院自动化研究所. 中国科学院大学. 2021.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace