CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 博士学位论文
题名平行交通系统中的预测与控制关键技术研究
作者戴星原
答辩日期2022-08-21
文献子类博士
授予单位中国科学院自动化研究所
授予地点中国科学院自动化研究所
导师王飞跃
关键词平行交通系统 交通预测 交通控制 深度学习 强化学习
学位名称工学博士
学位专业控制理论与控制工程
英文摘要

城市交通系统是典型的社会物理信息系统,参与主体众多且关联复杂。因此,交通问题的解决需要综合考虑其中的工程复杂性与社会复杂性。在此背景下,平行交通系统应运而生。平行交通系统首先构建与实际交通系统对应的软件定义的人工交通系统,然后在人工系统中通过计算实验产生大量数据,实现交通现象的涌现,并完成交通问题的因果溯源与交通管控策略的全面优化,最后基于人工交通系统与实际交通系统的平行执行,通过虚实空间的反馈闭环,实现对实际交通系统的有效引导。

平行交通系统的虚实空间架构为实现复杂交通环境下安全、高效的管理与控制提供了解决方案。为了进一步应对交通系统的规模性、不确定性、长期变化引起的复杂性问题,本文围绕平行交通系统中的交通流时序建模、预测与交通信号控制展开系统性研究,整体内容包括 3 个部分:

1. 平行交通系统中的交通流时序建模与预测方法研究。交通流包含复杂的非线性时空依赖特性,这使得交通流时序建模与准确预测非常困难。为此,本文提出基于趋势的交通流时序建模与预测方法,将交通流序列中的确定性与不确定性分离,通过简单的趋势计算建模交通流稳态特性,基于去趋势序列预测建模交通流动态特性,以提升交通流预测模型的泛化性能。去趋势序列预测模型包含单点预测模型 DeepTrend 与多点预测模型 DeepTrend 2.0。DeepTrend 通过两种神经网络模块分别实现交通流序列趋势估计与去趋势交通流序列预测,并以端到端形式训练整体网络。相比基于原始数据的交通流预测方法,DeepTrend 具有更高的预测精度。进一步,DeepTrend 2.0 考虑交通空间特性,权衡了深度学习大规模交通流预测模型的精度与复杂度。该模型基于构造的路网检测点时空图像,使用去趋势机制提取交通短期时序特征,通过轻量级深度卷积模块学习交通流的时空依赖关系。上述方法保证了预测模型的高精度与低复杂度,其中去趋势机制的引入显著降低了模型参数对预测精度的影响,相比于未引入去趋势的预测,去趋势机制使模型在真实交通流数据集的 5 分钟、15 分钟、45 分钟预测平均相对误差由 12.4%、12.8%、15.2%,分别下降到 10.5%、11.3%、12.1%。趋势描述了实际系统的交通流时序特征,为平行交通系统的优化与控制提供模型支撑。

2. 基于人工交通系统的交通信号控制策略优化方法研究。平行交通系统中的交通信号控制策略优化需同时保证策略性能与优化速度,以满足大规模城市多路口协同控制的最优性与实时性需求。 为此,本文借助人工交通系统的计算实验,分别针对单路口与多路口场景提出了基于预测学习的交通信号策略优化方法,通过预测与决策模块训练阶段辅助,执行阶段分离,保证了信号控制策略的有效性与实时性。在单路口场景,构建基于图像的世界模型实现路口交通状态的细粒度描述。世界模型引入了与高维交通图像空间对应的低维隐空间,并替代交通环境在隐空间产生样本辅助策略优化。该方法提升了策略探索能力与数据利用率,同时使信号决策具备可解释性。优化后的策略在单路口控制中相比基准方法近端策略优化平均降低排队长度 21.2%。进一步,在多路口场景提出了动态感知多智能体强化学习策略优化方法 DAMA(Dynamics-Aware Multi-AgentReinforcement Learning),通过全局图网络全面协调智能体决策,同时引入时空数据预测任务辅助模型学习有效的交通状态表征,实现了多路口场景高效策略学习。在包含 25 个路口的路网测试结果显示,DAMA 策略比无预测学习图网络策略降低路网整体延误 15%。基于预测学习的交通信号策略优化方法为平行交通信号控制在大规模场景下的应用研究奠定基础。

3. 虚实互动的平行交通信号控制方法研究。面向交通信号控制长期决策支持与大规模路网协同控制问题,本文从离线策略生成与在线策略生成的角度提出两种平行交通信号控制方法。基于离线策略生成的信号控制方法 TOPADS(Trend-and Offline-Reinforcement-Learning-Based Parallel Decision Support)通过交通流趋势建模路口交通模式,利用实际交通数据与离线强化学习算法优化控制策略,并以此构建决策支持库,通过推荐与持续优化实现对不同路口交通模式的长期决策支持。基于在线策略生成的信号控制方法 ATSPC(Artificial-Transportation-Systems-Based Predictive Control)面向近二百个路口的大规模路网实时协同控制问题,使用人工交通系统在线预测推演实际系统在各阶段的运行状态,并通过基于 DAMA 的协同策略优化在高维策略空间实现高效的策略学习,及时生成近似最优控制策略应对实时变化的交通需求。所提出的两种平行交通信号控制方法为实现复杂交通环境下灵活、有效、实时的交通信号控制提供了解决方案。

语种中文
页码214
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/49921]  
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
戴星原. 平行交通系统中的预测与控制关键技术研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2022.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace