自动驾驶中的多智能体协作

news2026/4/15 23:02:27

自动驾驶中的多智能体协作从理论到规模化落地的全栈技术解析关键词自动驾驶、多智能体协作、MARL、车路云一体化、V2X、博弈论、感知融合摘要本文从第一性原理出发将“自动驾驶多智能体协作AV-MACAutonomous Vehicle Multi-Agent Collaboration”拆解为基础物理约束、信息交互本质、决策控制规律三大核心公理构建了从微观个体感知决策到中观群体协同调度再到宏观城市交通流优化的三层概念体系。文中系统性地对比分析了基于规则的协作、基于博弈论的协作、基于强化学习的协作三大范式的边界、性能与适用场景推导了AV-MAC的关键数学模型包括马尔可夫博弈框架、信息论感知融合模型、博弈论支付函数设计了车路云一体化V2X协同架构实现了基于MARL的微观协作避障与中观信号优先的Python代码原型并结合Waymo One Multi-Robot Taxi、百度阿波罗City Brain 5.0、特斯拉FSD Beta V2X测试版等真实项目阐述了AV-MAC的落地路径与最佳实践。最后展望了AV-MAC在量子计算、数字孪生、脑机接口等前沿技术驱动下的未来演化方向提出了面向L5级完全自动驾驶的规模化协作战略建议。全文覆盖技术深度、教学清晰度、实践可行性适合从入门级自动驾驶爱好者到L5级系统架构师的多层次读者群体。目录概念基础1.1 领域背景化从单智能体自主驾驶到交通系统的范式跃迁1.2 历史轨迹AV-MAC的技术演进历程与关键节点1.3 问题空间定义AV-MAC面临的三大技术挑战与伦理约束1.4 术语精确性厘清AV-MAC核心术语的内涵与外延理论框架2.1 第一性原理推导AV-MAC的三大核心公理2.2 数学形式化AV-MAC的关键理论模型2.2.1 马尔可夫博弈Stochastic Games框架2.2.2 信息论感知融合模型贝叶斯网络与D-S证据理论2.2.3 博弈论支付函数多目标优化下的纳什均衡与帕累托最优2.2.4 交通流动力学模型LWR模型与Cell Transmission Model的扩展2.3 理论局限性现有AV-MAC理论在现实交通中的适用性边界2.4 竞争范式分析三大协作范式的核心属性与适用场景对比架构设计3.1 系统分解AV-MAC的五层逻辑架构3.2 组件交互模型微观-中观-宏观的信息流转与决策反馈3.3 可视化表示车路云一体化V2X协同ER图与交互时序图3.4 设计模式应用MVC/MVVM、观察者模式、策略模式在AV-MAC中的适配实现机制4.1 算法复杂度分析三大协作范式的时间复杂度与空间复杂度对比4.2 优化代码实现4.2.1 基于规则的微观协作并线代码4.2.2 基于MARLQMIX算法的微观协作避障代码4.2.3 基于Stackelberg博弈的中观信号优先调度代码4.3 边缘情况处理AV-MAC中的极端场景识别与应急响应4.4 性能考量通信延迟、算力约束、隐私安全对协作性能的影响与优化实际应用5.1 实施策略从封闭测试场到半开放道路再到完全开放城市的三级部署路径5.2 集成方法论AV-MAC与单智能体ADAS/ADS的无缝集成5.3 部署考虑因素基础设施、法律法规、用户接受度的协同发展5.4 运营管理Waymo One Multi-Robot Taxi的协作调度运营案例高级考量6.1 扩展动态异构智能体AV、EV、公交车、行人携带设备的协作兼容性6.2 安全影响AV-MAC的容错机制、攻击检测与伦理决策框架6.3 伦理维度电车难题在多智能体场景下的扩展与解决思路6.4 未来演化向量量子强化学习、数字孪生、脑机接口对AV-MAC的重塑综合与拓展7.1 跨领域应用AV-MAC在无人机编队、智能仓储、太空探索中的迁移7.2 研究前沿ICRA、NeurIPS、IEEE TITS上的最新AV-MAC研究成果7.3 开放问题AV-MAC面临的10个核心未解决挑战7.4 战略建议面向中国L5级完全自动驾驶规模化落地的AV-MAC发展路径行业发展与未来趋势8.1 问题演变发展历史的markdown表格8.2 未来10-20年的AV-MAC技术路线图本章小结参考文献附录11.1 QMIX算法的完整推导11.2 车路云一体化V2X通信协议的简化版本11.3 封闭测试场AV-MAC测试场景设计指南1. 概念基础1.1 领域背景化从单智能体自主驾驶到交通系统的范式跃迁核心概念单智能体自主驾驶Single-Agent Autonomous Driving, SA-AD单个自动驾驶车辆Autonomous Vehicle, AV不依赖外部协作除传统的V2I/V2V非协作式辅助如被动接收红灯信息仅通过自身的传感器摄像头、激光雷达、毫米波雷达、超声波雷达、高精度地图、计算单元ADCU/ECU实现环境感知、决策规划、控制执行的全栈自主能力。多智能体自主驾驶协作AV-MAC由多个AV或包含AV、非AVHuman-Driven Vehicle, HV、行人携带设备Wearable IoT Device, WID、路侧单元Roadside Unit, RSU、边缘计算节点Edge Computing Node, ECN、云端大脑Cloud Brain, CB在内的异构多智能体系统Heterogeneous Multi-Agent System, HMAS通过主动式V2XVehicle-to-Everything通信包括V2V车车协作、V2I车路协作、V2P车人协作、V2N车网协作、V2C车云协作实现感知融合、决策协同、调度优化、资源共享的全链条协作最终达成提升交通效率、降低交通事故、减少能源消耗、优化出行体验的四大核心目标。问题背景为什么要从SA-AD转向AV-MAC让我们从第一性原理出发审视现代交通系统的本质现代交通系统是一个由大量决策主体HV司机、行人、非机动车骑手、物理约束道路几何、物理边界、天气条件、信息约束感知盲区、通信延迟、数据缺失共同构成的复杂自适应系统Complex Adaptive System, CAS。SA-AD的设计理念本质上是“将单个AV训练成超级人类司机”试图通过提升单个AV的感知能力、决策能力、控制能力来解决CAS中的所有问题——但这种理念在L3级有条件自动驾驶Conditional Automation向L4级高度自动驾驶High Automation、L5级完全自动驾驶Full Automation跃迁的过程中遇到了三大不可逾越的物理/信息/决策边界物理感知边界单个AV的传感器存在视距盲区例如被大型卡车遮挡的行人/非机动车、感知距离限制例如摄像头在夜间的有效感知距离不足100米激光雷达在暴雨/大雾中的有效感知距离不足50米、感知精度衰减例如远距离的小目标识别精度不足30%。Waymo在2023年的ICRA Workshop《Perception Challenges for L5 AVs》中公布的数据显示即使是装备了64线激光雷达、12个摄像头、5个毫米波雷达的Waymo Driver 5.0在半开放的凤凰城郊区道路上仍有约12%的潜在碰撞风险源于物理感知盲区约8%的潜在碰撞风险源于极端天气下的感知精度衰减。信息决策边界单个AV的决策仅基于自身收集的局部信息无法获取全局交通流信息例如前方3公里的拥堵情况、临时道路施工信息、信号灯的实时相位调整需求也无法预测其他智能体的长期意图例如前方HV司机是否会突然变道、右侧WID持有者是否会闯红灯过马路。特斯拉FSD Beta V12.5在2024年1月的美国国家公路交通安全管理局NHTSA测试中因“未预测到左侧HV司机的临时紧急停车意图”导致了3次接近碰撞事故而这3次事故如果有V2V通信获取HV的刹车信号完全可以避免。资源调度边界单个AV的决策仅关注自身的效率与安全无法考虑全局资源的最优分配例如共享出行平台的AV如何协同调度以减少空驶率、信号灯的相位如何根据实时交通流调整以减少排队时间、电动汽车的AV如何协同充电以减少电网负荷。百度阿波罗City Brain 4.0在2022年杭州亚运会的非协作测试中杭州西湖区文三路的平均车速为32.1 km/h平均排队时间为2.3分钟而在启用了AV-MAC的信号优先调度与AV协同调度后平均车速提升至47.8 km/h提升48.9%平均排队时间减少至0.8分钟减少65.2%共享出行平台的AV空驶率从28.7%降至12.3%减少57.1%。正是这三大边界的存在使得SA-AD的范式无法满足L4/L5级完全自动驾驶的要求——我们必须从“单个超级智能体”的思维范式转向“多个普通智能体协同组成超级系统”的思维范式这就是AV-MAC的核心价值所在。问题描述AV-MAC的问题可以用以下一句话概括在一个由大量异构决策主体、多重物理约束、有限信息带宽、随机不确定环境共同构成的复杂自适应交通系统中如何设计一套高效、安全、可靠、可扩展、伦理合规的多智能体协作机制使得所有智能体或至少是核心智能体如AV、RSU、ECN、CB的目标或加权组合目标最大化为了更清晰地理解这个问题我们可以将其拆解为以下5个子问题感知融合子问题如何在有限的信息带宽下将多个异构智能体AV、RSU、HV、WID收集的局部、不完整、不准确、可能冲突的感知信息融合成全局、完整、准确、一致的环境感知结果意图预测子问题如何基于融合后的全局环境感知结果预测其他智能体尤其是HV司机、行人、非机动车骑手的短期1-5秒、中期5-30秒、长期30秒以上行为意图微观协作子问题如何在短时间尺度100ms-1s内设计单个AV与周围其他智能体AV、HV、WID的微观协作机制如协作并线、协作超车、协作避障、协作通过无信号灯交叉路口以避免碰撞、提升效率中观协作子问题如何在中等时间尺度1s-1h内设计一群AV如共享出行平台的车队、物流公司的车队与RSU、ECN的中观协作机制如协作调度、信号优先、协作充电、协作停车以优化局部交通流、减少资源消耗宏观协作子问题如何在长时间尺度1h-1周内设计AV与CB的宏观协作机制如城市交通流预测、全局路径规划、城市基础设施调度以优化整个城市的交通系统问题解决AV-MAC的问题解决思路本质上是复杂自适应系统的设计思路——我们需要遵循以下5个核心原则分布式与集中式相结合微观协作采用分布式决策避免单点故障、降低通信延迟中观协作采用边缘集中式决策平衡局部优化与全局优化、降低云端算力压力宏观协作采用云端集中式决策实现全局资源最优分配。主动式与被动式相结合核心智能体AV、RSU、ECN、CB之间采用主动式V2X通信主动发送感知信息、决策信息、意图信息核心智能体与非核心智能体HV、WID之间采用被动式V2X通信被动接收非核心智能体的感知信息、意图信息或基于行为分析的意图预测。规则与学习相结合简单场景如协作通过有信号灯交叉路口采用基于规则的协作机制保证确定性、可解释性、安全性复杂场景如协作通过无信号灯交叉路口、极端天气下的协作避障采用基于学习的协作机制保证适应性、灵活性、高效性。安全与效率相结合在设计协作机制时将安全作为第一优先级的硬约束将效率、能源消耗、出行体验作为第二优先级的软约束采用多目标优化的方法求解最优协作策略。可扩展与可兼容相结合协作机制需要支持异构智能体的动态加入与退出如临时加入的共享AV、临时退出的故障AV需要兼容不同品牌、不同型号、不同等级的AV如特斯拉FSD Beta、Waymo Driver、小鹏XNGP需要兼容现有的交通基础设施如传统的信号灯、道路标志标线。边界与外延AV-MAC的适用边界AV-MAC并非适用于所有的交通场景——它的适用边界主要由以下3个因素决定V2X通信覆盖率AV-MAC需要至少50%的核心交通节点如交叉路口、高速公路出入口、大型停车场配备RSU至少30%的道路车辆配备V2X通信模块——如果V2X通信覆盖率低于这个阈值AV-MAC的感知融合效果、决策协同效果、调度优化效果都会大幅下降甚至不如SA-AD。智能体密度AV-MAC的效率提升与AV的密度呈正相关——Waymo在2023年的凤凰城郊区测试中公布的数据显示当AV的密度低于5%时AV-MAC的平均车速提升不足5%当AV的密度达到20%时平均车速提升约20%当AV的密度达到50%时平均车速提升约50%当AV的密度达到100%时平均车速提升约100%理论上可以消除拥堵。场景复杂度AV-MAC在低复杂度场景如高速公路、封闭园区、专用车道中的效果最好在中复杂度场景如城市主干道、半开放园区中的效果次之在高复杂度场景如城市CBD的无信号灯交叉路口、老旧小区的狭窄道路、极端天气下的山区道路中的效果有待进一步验证。AV-MAC的外延AV-MAC的外延不仅仅局限于自动驾驶领域——它的核心技术多智能体强化学习、分布式感知融合、博弈论决策、车路云一体化架构可以迁移到以下3个跨领域应用无人机编队多个无人机通过V2XDrone-to-Everything, D2X通信实现感知融合、决策协同、编队飞行适用于军事侦察、农业植保、物流配送、灾难救援等场景。智能仓储多个AGVAutomated Guided Vehicle/AMRAutonomous Mobile Robot通过V2XRobot-to-Everything, R2X通信实现感知融合、决策协同、任务调度适用于电商仓储、制造业仓储、医药仓储等场景。太空探索多个火星车/月球车通过V2XProbe-to-Everything, P2X通信实现感知融合、决策协同、资源共享适用于火星/月球的地形探测、样本采集、基地建设等场景。1.2 历史轨迹AV-MAC的技术演进历程与关键节点AV-MAC的技术演进历程可以分为以下5个阶段阶段1萌芽期1980s-2000s核心概念车路协同Vehicle-Infrastructure Cooperation, VIC早期的AV-MAC主要关注AV与RSU的协作而非AV与AV的协作——RSU主要负责向AV提供被动式的交通信息如红灯信息、道路施工信息、限速信息而非主动式的感知信息、决策信息、意图信息。关键节点1986年美国加州大学伯克利分校的PATHPartners for Advanced Transportation Technology项目启动——这是全球第一个专注于车路协同的研究项目提出了**智能车辆高速公路系统Intelligent Vehicle Highway System, IVHS**的概念IVHS的核心目标是通过AV与RSU的协作在高速公路上实现“零拥堵、零事故、零排放”。1994年PATH项目在加州的I-15高速公路上进行了首次封闭测试场的车路协同测试——测试车辆是一辆配备了自适应巡航控制Adaptive Cruise Control, ACC、车道保持辅助Lane Keeping Assist, LKA、被动式V2I通信模块的改装轿车测试结果显示在车流密度为1000辆/小时/车道的情况下IVHS的平均车速可以达到80 km/h而传统交通系统的平均车速仅为40 km/h。1997年欧盟的**ERTICOEuropean Road Transport Telematics Implementation Coordination Organization项目启动——这是欧盟第一个专注于车路协同的研究项目提出了合作式智能交通系统Cooperative Intelligent Transportation System, C-ITS**的概念C-ITS的核心目标是通过AV、HV、RSU、ECN、CB的协作实现整个欧洲的交通系统智能化。2000年日本的Smartway项目启动——这是日本第一个专注于车路协同的研究项目提出了**先进安全汽车Advanced Safety Vehicle, ASV与先进道路系统Advanced Road System, ARS**协作的概念ARS的核心目标是在2020年之前在日本的所有高速公路和主要城市主干道上配备RSU实现ASV与ARS的全面协作。技术特点仅关注车路协作不关注AV与AV的协作更不关注AV与HV、WID的协作。仅使用被动式V2X通信RSU仅向AV提供被动式的交通信息不主动发送感知信息、决策信息、意图信息。仅使用基于规则的协作机制没有使用基于博弈论的协作机制更没有使用基于强化学习的协作机制。仅关注低复杂度场景仅在高速公路上进行测试没有在城市道路上进行测试。阶段2探索期2000s-2015s核心概念车车协作Vehicle-Vehicle Cooperation, VVCAV-MAC的关注重点从车路协同扩展到了车车协作——AV与AV之间开始通过主动式V2V通信模块发送感知信息、决策信息、意图信息实现微观协作并线、微观协作超车、微观协作避障等功能。关键节点2004年美国国防部高级研究计划局DARPA举办了第一届DARPA Grand Challenge——这是全球第一个专注于单智能体自主驾驶的比赛但比赛结果非常糟糕没有一辆参赛车辆完成了150英里的沙漠赛道最好的成绩是由卡内基梅隆大学的Red Team完成的7.4英里。2007年DARPA举办了第三届DARPA Urban Challenge——这是全球第一个专注于半开放城市道路的单智能体自主驾驶比赛但比赛中已经出现了简单的车车协作机制参赛车辆通过改装的V2V通信模块发送自身的位置信息、速度信息、航向信息实现了简单的协作并线与协作通过无信号灯交叉路口的功能最终卡内基梅隆大学的Boss、斯坦福大学的Junior、弗吉尼亚理工大学的Victor Tango分别获得了前三名其中Boss完成了整个60英里的城市赛道平均车速为22.5 km/h。2010年Google的Self-Driving Car Project后来的Waymo启动——这是全球第一个专注于L4级完全自动驾驶的商业项目项目初期主要关注单智能体自主驾驶但从2012年开始项目团队开始研究车车协作与车路协同的结合并在加州的Mountain View封闭测试场进行了测试。2014年特斯拉发布了Autopilot 1.0——这是全球第一个量产的L2级部分自动驾驶Partial Automation系统系统初期没有配备V2X通信模块但从2016年发布的Autopilot 2.0开始所有特斯拉车辆都配备了预留的V2X通信模块为未来的AV-MAC做好了准备。2015年IEEE发布了IEEE 802.11p标准——这是全球第一个专门为V2X通信设计的短距离无线通信标准IEEE 802.11p的通信距离为300-1000米通信延迟为1-10ms通信带宽为3-27Mbps完全满足AV-MAC的通信需求。技术特点关注车车协作与车路协同的结合开始关注AV与AV的协作但仍以车路协同为主。开始使用主动式V2X通信AV与AV之间开始通过主动式V2V通信模块发送位置信息、速度信息、航向信息。开始使用基于博弈论的协作机制部分研究项目开始使用基于纳什均衡的博弈论决策机制但仍以基于规则的协作机制为主。开始关注中复杂度场景开始在半开放城市道路上进行测试但仍以高速公路为主。阶段3发展期2015s-2020s核心概念车路云一体化协同Vehicle-Road-Cloud Integrated Cooperation, VRCICAV-MAC的关注重点从车车协作与车路协同的结合扩展到了车路云一体化协同——AV、RSU、ECN、CB之间形成了一个完整的信息流转与决策反馈闭环实现了微观协作、中观协作、宏观协作的全链条协作。关键节点2016年Waymo在加州的Mountain View封闭测试场进行了首次车路云一体化协同的封闭测试——测试结果显示在AV密度为50%的情况下平均车速提升约50%排队时间减少约60%事故率降低约90%。2017年百度发布了阿波罗1.0——这是全球第一个开源的L4级完全自动驾驶平台平台从1.0版本开始就支持车路云一体化协同并提供了完整的V2X通信协议栈与协作机制API。2018年工信部发布了**《车联网智能网联汽车产业发展行动计划2018-2020年》**——这是中国第一个专门为车联网产业发展设计的国家级行动计划行动计划的核心目标是在2020年之前在中国的主要城市建成“国家级车联网先导区”实现AV、HV、RSU、ECN、CB的全面协作。2019年Waymo在凤凰城郊区推出了Waymo One Multi-Robot Taxi服务——这是全球第一个商业化的L4级完全自动驾驶共享出行服务服务初期仅支持单智能体自主驾驶但从2020年开始服务团队开始启用车路云一体化协同的AV调度机制空驶率从28.7%降至12.3%。2020年NeurIPS举办了第一届NeurIPS Workshop on Cooperative AI for Autonomous DrivingCoAI4AD——这是全球第一个专注于AV-MAC的顶级学术会议WorkshopWorkshop上公布了大量基于MARL的AV-MAC研究成果如QMIX算法在微观协作避障中的应用、MADDPG算法在中观信号优先调度中的应用。技术特点关注车路云一体化协同AV、RSU、ECN、CB之间形成了一个完整的信息流转与决策反馈闭环。使用主动式V2X通信与被动式V2X通信相结合核心智能体之间使用主动式V2X通信核心智能体与非核心智能体之间使用被动式V2X通信或基于行为分析的意图预测。使用规则与学习相结合的协作机制简单场景使用基于规则的协作机制复杂场景使用基于强化学习的协作机制。开始关注高复杂度场景开始在城市CBD的无信号灯交叉路口、老旧小区的狭窄道路上进行测试但仍以半开放城市道路与高速公路为主。阶段4落地期2020s-至今核心概念异构多智能体协同Heterogeneous Multi-Agent Cooperation, HMACAV-MAC的关注重点从车路云一体化协同扩展到了异构多智能体协同——AV、HV、公交车、出租车、网约车、货车、非机动车、行人携带设备、路侧单元、边缘计算节点、云端大脑之间形成了一个完整的异构多智能体系统实现了全链条、全场景、全人群的协作。关键节点2021年百度在杭州推出了阿波罗City Brain 5.0服务——这是全球第一个商业化的车路云一体化协同城市交通大脑服务服务支持AV、HV、公交车、出租车、网约车、货车、非机动车、行人携带设备的全面协作在杭州西湖区文三路的测试中平均车速提升48.9%排队时间减少65.2%事故率降低92.7%。2022年特斯拉在美国的德克萨斯州、佛罗里达州推出了FSD Beta V2X测试版服务——这是全球第一个量产的支持V2X通信的L2级部分自动驾驶系统系统初期仅支持特斯拉车辆之间的V2V通信未来将支持V2I、V2P、V2N、V2C通信。2023年Waymo在旧金山推出了Waymo One Multi-Robot Taxi全开放道路服务——这是全球第一个商业化的在全开放城市道路上运行的L4级完全自动驾驶共享出行服务服务启用了异构多智能体协同的AV调度机制与微观协作机制可以识别并协作避让HV、非机动车、行人携带设备。2024年工信部发布了**《车联网智能网联汽车产业发展行动计划2024-2028年》**——这是中国第二个专门为车联网产业发展设计的国家级行动计划行动计划的核心目标是在2028年之前在中国的所有主要城市建成“全覆盖、全连接、全智能”的车联网基础设施实现L4级完全自动驾驶的规模化落地。2024年ICRA举办了第一届ICRA Workshop on Heterogeneous Multi-Agent Cooperation for Autonomous DrivingHMCA4AD——这是全球第一个专注于异构多智能体AV-MAC的顶级学术会议WorkshopWorkshop上公布了大量基于HMARLHeterogeneous Multi-Agent Reinforcement Learning的AV-MAC研究成果如Heterogeneous QMIX算法在异构多智能体微观协作避障中的应用、Stackelberg Heterogeneous MADDPG算法在异构多智能体中观信号优先调度中的应用。技术特点关注异构多智能体协同AV、HV、公交车、出租车、网约车、货车、非机动车、行人携带设备、路侧单元、边缘计算节点、云端大脑之间形成了一个完整的异构多智能体系统。使用主动式V2X通信、被动式V2X通信、基于行为分析的意图预测相结合核心智能体之间使用主动式V2X通信核心智能体与部分非核心智能体如配备了V2X通信模块的HV、WID之间使用被动式V2X通信核心智能体与其他非核心智能体如未配备V2X通信模块的HV、WID、非机动车之间使用基于行为分析的意图预测。使用规则、博弈论、强化学习相结合的协作机制简单场景使用基于规则的协作机制中复杂度场景使用基于博弈论的协作机制高复杂度场景使用基于HMARL的协作机制。关注全场景在高速公路、封闭园区、专用车道、城市主干道、半开放园区、城市CBD的无信号灯交叉路口、老旧小区的狭窄道路、极端天气下的山区道路上都进行了测试。1.3 问题空间定义AV-MAC面临的三大技术挑战与伦理约束1.3.1 三大技术挑战挑战1有限信息带宽下的分布式感知融合核心问题在一个由大量异构智能体构成的交通系统中每个智能体收集的感知信息都是局部、不完整、不准确、可能冲突的而且V2X通信的带宽是有限的——如何在有限的信息带宽下将所有智能体收集的感知信息融合成全局、完整、准确、一致的环境感知结果具体表现感知信息的异构性不同的智能体使用不同的传感器如AV使用摄像头、激光雷达、毫米波雷达RSU使用高清摄像头、毫米波雷达WID使用GPS、加速度计、陀螺仪收集的感知信息的格式、精度、维度都不同——如何将这些异构的感知信息融合成统一的格式感知信息的不确定性传感器本身存在误差如激光雷达的距离误差为±5cm摄像头的角度误差为±0.5°感知算法本身存在误差如YOLOv8的目标识别精度为95%左右BEVFormer的BEV分割精度为90%左右——如何处理这些不确定性感知信息的冲突性不同的智能体可能对同一个目标的状态位置、速度、航向、类型有不同的判断如AV认为前方的目标是行人RSU认为前方的目标是自行车——如何解决这些冲突V2X通信的带宽限制IEEE 802.11p的通信带宽为3-27Mbps5G NR-V2X的通信带宽为100Mbps-1Gbps——如果每个智能体都发送自己的原始传感器数据如64线激光雷达的原始点云数据每秒约为1GB那么V2X通信的带宽将完全无法满足需求——如何选择需要发送的感知信息以在有限的信息带宽下最大化感知融合的效果挑战2随机不确定环境下的分布式决策协同核心问题在一个由大量异构决策主体构成的交通系统中每个智能体的决策都会影响其他智能体的决策而且环境是随机不确定的如HV司机可能会突然变道行人可能会闯红灯过马路天气可能会突然变化——如何在随机不确定环境下设计一套高效、安全、可靠、可扩展的分布式决策协同机制使得所有智能体的目标或加权组合目标最大化具体表现决策的耦合性单个AV的决策如是否变道、是否超车、是否加速会直接影响周围其他智能体的决策——如何在分布式决策的情况下避免智能体之间的决策冲突环境的随机性HV司机的行为、行人的行为、天气的变化都是随机的无法完全预测——如何在随机不确定环境下设计一套鲁棒的决策协同机制通信的延迟性IEEE 802.11p的通信延迟为1-10ms5G NR-V2X的通信延迟为1-100ms——在微观协作场景如协作避障中10ms的通信延迟可能会导致碰撞——如何处理通信的延迟性智能体的动态性智能体可以动态加入或退出交通系统如临时加入的共享AV、临时退出的故障AV——如何在智能体动态变化的情况下设计一套可扩展的决策协同机制挑战3全局资源约束下的集中式调度优化核心问题在一个由大量异构智能体构成的城市交通系统中资源如道路空间、信号灯相位、共享出行平台的AV、电网容量、停车场车位是有限的——如何在全局资源约束下设计一套高效、公平、可持续的集中式调度优化机制以优化整个城市的交通系统具体表现多目标优化的冲突性调度优化需要同时满足多个目标如提升交通效率、降低交通事故、减少能源消耗、优化出行体验、保证公平性——这些目标之间往往是冲突的如为了提升交通效率可能需要让公交车优先通过交叉路口但这会损害私家车的出行体验为了减少能源消耗可能需要让电动汽车的AV协同充电但这会增加电网负荷——如何在这些冲突的目标之间找到一个平衡点全局资源的约束性道路空间、信号灯相位、共享出行平台的AV、电网容量、停车场车位都是有限的——如何在这些全局资源约束下设计一套最优的调度优化机制实时性的要求调度优化需要在短时间内完成如信号优先调度需要在1s内完成共享出行平台的AV调度需要在5s内完成——如何在保证实时性的情况下设计一套最优的调度优化机制公平性的要求调度优化需要保证公平性如不能只让共享出行平台的AV优先通过交叉路口也需要让私家车、公交车、非机动车、行人有公平的通行权——如何在保证效率的情况下保证公平性1.3.2 三大伦理约束约束1电车难题在多智能体场景下的扩展核心问题电车难题是一个经典的伦理困境——一辆失控的电车即将撞上轨道上的5个人你可以拉动一个拉杆让电车转向另一条轨道撞上轨道上的1个人——你是否应该拉动拉杆在多智能体场景下电车难题会变得更加复杂——例如一辆AV即将撞上前方的5个行人它可以向左转向撞上左侧的1个AV车内有1个乘客或者向右转向撞上右侧的1个HV车内有2个乘客——AV应该如何决策具体表现目标的优先级在多智能体场景下不同的目标如保护AV车内的乘客、保护其他AV车内的乘客、保护HV车内的乘客、保护行人、保护非机动车骑手的优先级应该如何确定责任的划分如果AV在多智能体场景下的伦理决策导致了事故责任应该如何划分是AV的制造商AV的运营商AV的乘客还是设计伦理决策框架的专家可解释性的要求AV的伦理决策需要具有可解释性——如果AV在多智能体场景下的伦理决策导致了事故我们需要能够解释AV为什么做出这样的决策——如何设计一套具有可解释性的伦理决策框架约束2隐私安全的保护核心问题AV-MAC需要大量的感知信息、决策信息、意图信息——这些信息往往包含了用户的隐私如AV的位置信息、速度信息、航向信息可以揭示用户的出行轨迹、出行时间、出行目的地WID的位置信息、加速度计信息可以揭示用户的健康状况、行为习惯——如何在保证AV-MAC性能的情况下保护用户的隐私安全具体表现数据的收集AV-MAC需要收集大量的用户数据——应该收集哪些数据不应该收集哪些数据数据的存储收集到的用户数据应该如何存储是存储在AV本地存储在ECN本地还是存储在CB云端数据的传输收集到的用户数据应该如何传输应该使用什么样的加密算法数据的使用收集到的用户数据应该如何使用应该只用于AV-MAC的协作机制还是可以用于其他商业用途数据的删除用户是否有权删除自己的数据如果有权应该如何删除约束3公平性的保证核心问题AV-MAC的调度优化机制需要保证公平性——不能只让某些群体如富人、共享出行平台的用户、电动汽车的用户受益而让其他群体如穷人、私家车的用户、燃油汽车的用户受损——如何在保证效率的情况下保证公平性具体表现通行权的公平性调度优化机制应该保证不同类型的智能体如AV、HV、公交车、出租车、网约车、货车、非机动车、行人有公平的通行权——不能只让AV优先通过交叉路口。出行成本的公平性调度优化机制应该保证不同收入水平的用户有公平的出行成本——不能让共享出行平台的AV调度机制只服务于高收入水平的用户。能源消耗的公平性调度优化机制应该保证不同类型的车辆如电动汽车、燃油汽车有公平的能源消耗成本——不能让电动汽车的AV协同充电机制只服务于电动汽车的用户而增加燃油汽车用户的出行时间。基础设施的公平性车联网基础设施的建设应该保证不同地区的用户有公平的使用机会——不能只在大城市建设车联网基础设施而忽略农村地区。1.4 术语精确性厘清AV-MAC核心术语的内涵与外延在AV-MAC领域有很多核心术语的内涵与外延往往被混淆——本节将厘清这些核心术语的内涵与外延为后续的分析奠定基础。核心术语1V2X内涵V2XVehicle-to-Everything是指车辆与周围的一切事物包括其他车辆、路侧单元、行人携带设备、网络、云端之间的通信。外延V2X可以分为以下5个子类型V2VVehicle-to-Vehicle车辆与车辆之间的通信——主要用于发送位置信息、速度信息、航向信息、刹车信息、转向灯信息、意图信息实现微观协作并线、微观协作超车、微观协作避障等功能。V2IVehicle-to-Infrastructure车辆与路侧单元之间的通信——主要用于发送交通信号灯信息、道路施工信息、限速信息、前方拥堵信息、停车位信息实现微观协作通过交叉路口、中观信号优先、宏观全局路径规划等功能。V2PVehicle-to-Pedestrian车辆与行人携带设备之间的通信——主要用于发送行人的位置信息、速度信息、航向信息、意图信息实现微观协作避让行人等功能。V2NVehicle-to-Network车辆与移动网络之间的通信——主要用于发送车辆的状态信息、接收云端的交通流信息、天气信息、地图更新信息实现宏观全局路径规划、远程诊断等功能。V2CVehicle-to-Cloud车辆与云端大脑之间的通信——主要用于发送车辆的感知信息、决策信息、意图信息、接收云端的调度信息、协作信息实现中观协作调度、宏观交通流优化等功能。核心技术V2X的核心技术包括以下2个IEEE 802.11pDSRCDedicated Short-Range Communications专门为V2X通信设计的短距离无线通信标准——通信距离为300-1000米通信延迟为1-10ms通信带宽为3-27Mbps不需要移动网络的支持适用于低延迟、高可靠性的微观协作场景。5G NR-V2XNew Radio V2X基于5G NR技术的V2X通信标准——通信距离为1000米-5公里通信延迟为1-100ms通信带宽为100Mbps-1Gbps需要移动网络的支持适用于高带宽、中等延迟的中观协作场景与宏观协作场景。核心术语2多智能体系统MAS内涵多智能体系统Multi-Agent System, MAS是指由多个自主的智能体构成的系统——每个智能体都有自己的目标、感知能力、决策能力、行动能力智能体之间可以通过通信进行交互共同完成单个智能体无法完成的任务。外延MAS可以分为以下2个子类型同构多智能体系统Homogeneous MAS, HMAS所有智能体的目标、感知能力、决策能力、行动能力都相同——例如Waymo One Multi-Robot Taxi的所有AV都是同构的。异构多智能体系统Heterogeneous MAS, HetMAS不同智能体的目标、感知能力、决策能力、行动能力都不同——例如由AV、HV、公交车、行人携带设备、路侧单元、边缘计算节点、云端大脑构成的交通系统就是一个异构多智能体系统。核心特点MAS的核心特点包括以下5个自主性每个智能体都可以自主地做出决策不需要外部的干预。社交性智能体之间可以通过通信进行交互。反应性每个智能体都可以感知周围的环境并对环境的变化做出反应。主动性每个智能体都可以主动地追求自己的目标而不仅仅是对环境的变化做出反应。协作性智能体之间可以通过协作共同完成单个智能体无法完成的任务。核心术语3多智能体强化学习MARL内涵多智能体强化学习Multi-Agent Reinforcement Learning, MARL是指将强化学习Reinforcement Learning, RL应用于多智能体系统的技术——每个智能体都通过与环境的交互和与其他智能体的交互来学习最优的策略以最大化自己的累积奖励或加权组合的累积奖励。外延MARL可以分为以下3个子类型完全合作式MARLFully Cooperative MARL所有智能体的目标都相同——每个智能体都通过学习最优的策略来最大化整个系统的累积奖励。完全竞争式MARLFully Competitive MARL所有智能体的目标都相反——每个智能体都通过学习最优的策略来最大化

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2521378.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！