一种基于规则迭代的无人车自学习控制方法

CORC > 自动化研究所 > 中国科学院自动化研究所 > 智能制造技术与系统研究中心

题名	一种基于规则迭代的无人车自学习控制方法
作者	张力夫
答辩日期	2021-05-27
文献子类	硕士
授予单位	中国科学院大学
授予地点	中国科学院自动化研究所
导师	汤淑明
关键词	无人车控制自主学习规则提取规则迭代
学位名称	工程硕士
学位专业	控制工程
英文摘要	近年来，无人驾驶引起社会的广泛关注。无人驾驶技术对改善城市交通和环境友好持续发展具有重要意义，同时还能提升驾驶安全性，有效降低事故发生率。无人车运动控制是无人驾驶领域不可或缺的关键技术之一。与传统的分为感知、认知、决策和控制的无人驾驶技术方案不同，AlphaGo Zero的出现为人们对机器自学习能力的研究树立了新的范式，本文借鉴人类学习驾驶技术的渐进过程，开展基于规则迭代的无人车自学习控制方法的研究，让无人车控制器能够通过自学习从完全不具备行驶能力，逐步达到具备安全平稳顺滑的行驶能力。本文基于深度强化学习方法，通过规则提取以及奖励规则迭代的方式，模拟人类学习驾驶车辆的渐进过程，在仿真环境下实现无人车安全平稳行驶，具体研究内容包括：（1）搭建Carla无人驾驶仿真平台，针对城镇道路环境下无人车运动控制任务进行仿真实验，验证DQN和DDPG两类典型深度强化学习算法的性能。（2）全面分析典型城镇道路环境下车辆行驶任务，根据交通规则、道路边界条件等类比人类学习驾驶行为，给出一套分级驾驶任务规则，并转化为学习算法中相应的奖惩规则。（3）基于获得的奖惩规则对DDPG算法的奖励函数部分提出改进，并优化了DDPG算法的状态空间。实验结果表明，提出方法有效提升了无人车控制器的平稳性和算法的训练效率，车辆的行驶任务平均完成度接近90%，且训练时间明显缩短，与原DQN和DDPG深度强化学习的训练结果相比有显著提升。
语种	中文
页码	84
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/44990]
专题	自动化研究所_智能制造技术与系统研究中心
推荐引用方式 GB/T 7714	张力夫. 一种基于规则迭代的无人车自学习控制方法[D]. 中国科学院自动化研究所. 中国科学院大学. 2021.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们