网络首发
融合理性驾驶约束的自动驾驶车辆纵向控制深度强化学习模型
杨贻凡;白霖涵;侯康宁;郑芳芳;【背景】纵向控制是自动驾驶车辆控制中的重要组成部分,其决策是否符合人类驾驶理性预期已成为当前研究关注的重点。然而,现有控制模型在构建过程中往往忽略人类驾驶行为特征,导致自动驾驶车辆的决策可能偏离人类预期。【目标】引导自动驾驶车辆在兼顾安全、效率与舒适的同时,做出更符合人类驾驶员预期的理性化决策。【方法】在构建兼顾安全性、效率与舒适性的多目标奖励函数基础上,引入理性驾驶约束(Rational Driving Constraint, RDC),提出了三种改进深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)的方法:DDPG+RDC Reward、DDPG+epRDC Reward、DDPG+RDC Loss,分别通过直接优化奖励函数、动态修正奖励函数以及在损失函数中引入约束的方式,对基础DDPG模型进行改进,并在两种速度场景下对所提方法及DDPG+RDC Reward-Loss融合方法的跟驰性能进行了测试。【数据】测试所用的前车轨迹数据提取自日本阪神高速Zen Traffic Data(ZTD)数据集。【结论】四种改进模型在RDC符合性方面均显著优于基础DDPG模型,其中DDPG+RDC Reward-Loss模型的RDC符合率提升超50%。在低速场景下,DDPG+RDC Reward、DDPG+epRDC Reward和DDPG+RDC Reward-Loss模型的最小碰撞时间大于4.8s,表现出更高的安全性;在中高速减速场景下,所有改进模型的平均跟驰距离较基础DDPG模型均缩短了8%以上,提高了跟驰效率;两种场景中,DDPG+epRDC Reward、DDPG+RDC Loss和DDPG+RDC Reward-Loss模型加速度方差较基础DDPG模型降低超过30%,显著提升了舒适性。综合来看,DDPG+RDC Reward-Loss融合模型的整体性能最优。【应用】研究为提升自动驾驶纵向决策的类人化水平提供了有效途径,对高级别自动驾驶车辆的实际应用具有参考价值。
客货混行场景下的小汽车换道行为建模与分析
杨逸宇;宋栋栋;冯婧;刘永涛;【背景】现实交通场景中,由换道行为引发的交通事故占比居高不下,揭示车辆换道行为的影响机理与决策机制至关重要。尽管现有研究已探讨了诸多影响换道行为的因素,但相关文献往往未能细致区分不同车辆类型。此外,许多传统模型未能充分考虑不可观测的异质性,限制了其对换道行为中复杂因素交互作用的解析能力。【方法】构建了考虑均值异质性的相关随机参数风险持续时间模型(HMCRP-HBDM),并分别在全小汽车交通流和客货混行交通流两种典型交互场景下,对比解析了当前车辆及周边车辆的动态特征对小汽车换道持续时间的影响机制。【数据】研究基于德国HighD自然驾驶高速公路数据集,该数据集涵盖了当前车道与目标车道中车辆的类型、速度、加速度等多维动态变量。【结果】两种场景下HMCRP-HBDM模型在拟合优度上均显著优于传统风险持续时间模型和随机参数风险持续时间模型。在全小车场景中,小汽车平均换道时间为6.61 s。换道时长受自车速度、加速度、当前车道前车速度及与目标车道前(后)车速度差的显著影响。其中,与目标车道前(后)车速度差变小(大),换道持续时间降低(增加)16.6%(16%)。客货混行场景中,小汽车平均换道时间为6.50 s。换道时长受自车加速度、当前车道(目标车道)后车加速度的显著影响。其中,当前车道(目标车道)后车加速度降低,换道持续时间降低43.2%(56.3%)。【应用】本研究可为复杂交互场景的换道行为建模与主动安全管控提供全新视角和有效理论支撑。
考虑覆盖与连通的城市低空起降点三维选址方法
杨博岩;刘鹏;陈晓静;田琼;王鹏飞;邹佳锦;【背景】低空起降点选址布局是城市低空飞行作业的前提保障,对于发展低空经济至关重要,但当前存在设施不足、缺少规划等现象。【目标】提出一种面向城市立体空间的低空起降点选址优化模型,旨在最小化建设成本,同时考虑需求覆盖率和起降点连通性。【方法】模型突破传统二维选址局限,将三维空间约束(建筑高程、起降点高度与飞行高度三者间的关系)与电池能耗、低空风速风向等融合,量化飞行距离对位置决策的影响。通过权衡覆盖与连通率迭代选点,采用最小生成树确保全局连通,并经冗余剪枝实现成本最低,最终获得满足覆盖与连通约束的最优解。【数据】使用地理信息系统(GIS)等技术获取了中国深圳市60余万栋建筑的真实地理数据,包含建筑经纬度、高度、高程、地形及用地性质等多源数据融合以验证模型的有效性。【结果】数值实验结果表明,在考虑覆盖与连通时,所提出的模型仅需部署14个起降点,即可覆盖深圳市95%的需求点,且形成了全连通低空起降点网络。【应用】构建了低空起降点自适应三维选址框架,为城市复杂环境下的低空起降点网络设计提供了理论依据与方法支撑。
用于交通流预测的元参数特征融合动态图网络
李鹏博;林之喆;张衡;周腾;谢海;曹春杰;【背景】精准的交通流预测面临复杂时空依赖建模的挑战。现有方法常因过度依赖局部关联而忽略全局模式,导致模型预测大规模路网时感受野受限。【目标】需要对交通流所固有的复杂时空模式在充分融合全局与局部时空特征的基础上进行全面建模,以此来做到有效精准的预测。【方法】提出了一种名为MFDNet的元参数特征融合动态图网络。该网络配备了元参数特征融合(MF)模块,通过充分融合交通流数据的全局与局部时空特征,以双重视角建模来充分捕捉交通流数据的时空相关性。MFDNet还将图卷积操作与全局特征池化操作相结合,并通过创新的元参数学习和时间注意力机制加以完善,从而动态地平衡了局部与全局特征的提取过程。【数据】在四个由加州交通局性能测量系统(PeMS)收集的交通流预测领域广泛使用的数据集上进行了充分的实验,严格验证了该模型的有效性。【结果】MFDNet模型在平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)三个关键指标上均展现出领先性能。模型在PEMS03数据集上达到了先进性能(MAE为15.06),在PEMS04、PEMS07以及PEMS08数据集上达到了最优性能(MAE分别为18.18、19.28、13.83)。与TWDGCN相比,MFDNet的平均绝对误差降低了1.03%到3.89%。
基于目标切换机制的分布式多列车鲁棒预测控制
何若冰;朱才梵;冯文件;陈莉蓉;杨欣;【背景】随着虚拟编组列车在道岔区段动态解编场景的复杂化,突发扰动事件下的协同失控风险显著增加。现有方法因缺乏故障响应闭环机制与动态安全约束保障,难以同时应对系统异常和不确定性干扰,威胁列车运行安全。【目标】构建面向突发事件的闭环控制理论,通过实时检测与动态控制重构,实现多列车安全轨迹的协同优化,提升运行控制的鲁棒性与安全性。【方法】基于残差检测与双层目标切换机制,提出动态鲁棒管模型预测控制框架:上层通过残差观测器实时捕捉系统异常,触发目标切换并生成安全轨迹;下层采用动态鲁棒管收缩律,通过在线滚动优化生成抗扰控制序列,确保多列车状态轨迹严格位于安全不变集内。【结果】相较于传统模型预测控制方法,所提方法在事故场景下速度与位置跟踪精度平均提升65%和59%,且计算效率满足实时性要求,验证了其在复杂扰动场景下的有效性。【结论】通过故障检测-目标切换-鲁棒控制的全流程覆盖,为解决虚拟编组列车动态解编协同失控难题提供了系统化方案,为城市轨道交通运营安全提供了理论支撑。
网联环境下借道左转交叉口设计与动态控制方法
宋成举;田恩光;王华荣;蒋贤才;【背景】既有研究主要聚焦传统交通环境下借道左转交叉口的信号优化控制,缺乏网联交通可测、可控、可诱导优势在此类交叉口的应用。【目标】为提升借道左转交叉口的通行效率,提出一种适合网联交通的信号优化控制方法。【方法】以车均延误最小为目标,根据网联自动驾驶车(Connected and Automated Vehicles, CAV)渗透率动态转换借道左转车道功能;基于不同车道功能考虑主、预信号协调关系及车辆驶离交叉口时间与主信号左转相位的关系,构建网联交通环境下借道左转交叉口信号优化控制模型,采用粒子群算法进行求解。【结论】仿真结果表明,在低、中、高交通负荷下,相较于对比方案,具有车道功能动态调整的两种信号优化方案车均延误分别降低了2.60%、6.10%,4.77%、15.43%和2.67%、9.35%。进一步分析表明,CAV渗透率、借道左转车道长度对提出方法的优化成效有着显著影响;当CAV渗透率不低于0.6时,借道左转车道宜调整为CAV专用车道,且CAV渗透率越高,优化方法成效越显著。【应用】提出方法为网联交通环境下借道左转交叉口的优化控制提供了理论支撑。
基于图注意力强化学习的电动自动驾驶运营车队实时控制
勉海荣;焦小刚;毕利;【背景】自动驾驶电动汽车(Autonomous Electric Vehicle,AEV)网约平台受车辆电量续航约束和出行需求时空动态不平衡性的双重挑战,严重制约运营连续性与商业效益。【目标】针对这一难题,本研究提出一种融合分层优化架构与强化学习的协同控制框架,旨在保障计算效率的同时最大化平台收益。【方法】研究首先将城市空间位置信息抽象为图节点,构建分层图注意力电动化自动驾驶按需出行(Electric Autonomous Mobility on Demand with Hierarchical Graph Attention,E-AMoD-HGA)框架:即时匹配可用车辆与需求、图注意力强化学习求解区域调度与充电需求、动态调度空闲车辆至高需求区域以及优化充电策略。该框架通过强化学习概率引导与整数规划验证的嵌套机制,共同实现AEV按需移动和充电控制系统的实时运营决策。其次,以有限时间窗内平台总收益最大化为目标,设计平衡移动-充电的联合动作,并通过建立AEV车队的状态信息,将AEV按需移动和充电控制问题转化为马尔科夫决策过程。【数据】基于纽约市不同区域场景的真实出行数据开展仿真实验。【结果】相较于传统的电动化自动驾驶按需出行(Electric Automated Mobility on Demand,E-AMoD)框架,本研究提出的框架方法在不同区域场景下实现每日收益提升1.6倍,计算效率提高超10倍。此外,图注意力强化学习方法展现出优异的零样本迁移能力,可有效适应不同服务区域拓展等复杂任务,充分验证了其工程实用价值与系统柔性。
基于图神经网络的铁路冷链运输网络链路预测
杨晓源;甘蜜;董鑫驰;李垚;彭涛;【背景】随着我国现代冷链物流体系的基本建成,未来发展的重点已逐步由骨干设施的选址与空间布局,转向对网络内部运作机制的优化与协同效率的提升。因此,把握运输需求在枢纽节点间的流通情况和变化趋势尤为重要。【方法】针对铁路冷链运输网络演化背后的复杂联系,提出了一种基于机器学习的链路预测方法以揭示潜在的网络结构。该方法包含学习样本构建、目标子图提取、节点属性收集等关键步骤,通过图神经网络模型判别城市间的运输联系,实现对铁路冷链网络节点间未来连边的预测。【数据】实验基于中铁特货2023~2024年货物运单数据构建冷链运输网络,对比不同网络规模和样本比例下的模型性能,确定合适的模型架构和超参数组合。【结果】与其他图神经架构相比,图同构网络受正负样本比例和子图规模波动影响较小,较为适合铁路冷链网络的应用背景。模型在验证集下的平均AUC达到0.947,预测集下的准确率达到84.2%,证明此方法能够有效捕捉城市间开展冷链运输的内在联系机制。【应用】使用图神经网络预测网络演化趋势是机器学习技术在铁路货运领域的应用的一次有益尝试,为铁路冷链运输部门的市场开发与运营优化提供了重要参考。
成网重载列车群组计划与运行计划协同优化
黄京金;倪少权;宋宗莹;吕苗苗;【背景】依托通信技术和列控技术快速发展,通过车车通讯实现虚拟编组的列车群组运行,成为重载铁路突破运能瓶颈的关键方法之一。【目标】为平衡群组运行下运能提升与运输效率降低的矛盾,研究路网层面群组列车编组、组群车站、群组规模、编组次序与列车运行计划协同优化问题。【方法】首先以离散时空网络模型描述成网重载列车群组与运行计划协同优化问题,以困难区段通过能力最大、列车旅行时间最小为目标优化上层群组计划,以列车停站时间最短为目标优化下层列车运行计划。上层设计递归分解算法解决群组计划组合爆炸,下层融合递归分解和人工水母算法快速求解列车运行计划。【数据】根据国能铁路包神南线装车站能力,生成130列理论列车开行数据进行验证。【结果】(1)算法高效,130列车的运行计划实现8 min内求解,群组与运行协同优化实现15 min内求解;(2)群组运行模式能够突破传统运行模式下的运能瓶颈,将困难区段线路能力利用率由理论值108.33%下降至69.44%,线路下游区段的线路能力利用率由84.17%下降至79.17%,困难区段由线路下游转移至上游单元列车汇聚区段;(3)采取群组运行模式能显著提升运输能力与运输效率,但群组规模变化对运输能力的影响小,对运输效率影响大,群组规模小时运输效率高。
政府补贴对共享自动驾驶运营商与用户的影响分析
李堉琨;龙泺安;王晗;宋文倩;牟振华;【背景】随着自动驾驶技术加速突破与共享出行模式深度融合,共享自动驾驶汽车(SAV)已成为重构城市交通服务体系的重要载体。然而,SAV运营商在推广初期面临车辆购置、算法研发等高额沉没成本与用户渗透率不足的双重压力,导致市场供需双侧协同激励不足,掣肘技术应用进程。【目标】为解决SAV出行初期市场推广失灵问题,解析政府补贴机制下的主体策略演化稳定性,探究多要素对系统均衡的影响机理,揭示补贴策略与SAV出行市场推广效率的作用关系。【方法】建立包含补贴因子的三方演化博弈模型,进行策略选择稳定性分析与参数灵敏度检验,设置基准情景开展仿真验证,实施20%补贴增幅的对比实验。【数据】基于共享自动驾驶出行实际运营数据与武汉市人群日常出行费用调查数据相结合,进行数据预处理后开展数值仿真实验。【结论】仿真结果表明:在基准条件下,政府补贴强度增加20%时,SAV服务商策略稳定于“积极提升服务质量”的收敛速度显著提升约46%。然而,过度补贴(如补贴增幅过高)可能导致系统失稳。最后,从补贴策略优化(如动态调控、与服务质量挂钩)、服务质量提升路径和用户激励机制三个维度提出建议,研究结论可为城市新型出行服务体系的政策设计提供理论支撑。