基于多智能体深度强化学习的体系任务分配方法

news2026/4/30 9:21:53

源自：指挥与控制学报

作者：林萌龙, 陈涛, 任棒棒, 张萌萌, 陈洪辉

摘要

1 背景

1.1 集中式决策VS分布式决策

图1集中式决策示意图

1.2 多智能体强化学习

2 问题描述

2.1 场景描述

图2分布式决策场景下的体系任务分配

2.2 状态空间、动作空间与奖励函数设计

3 基于MADDPG算法的作战体系任务分配模型

3.1 基于MADDPG任务分配算法框架

3.2 Actor网络结构

标题图6 Actor网络结构

3.3 Critic网络结构

图7 Critic网络结构

4 实验

4.1 对比算法设置

4.2 实验环境

4.3 实验结果分析

图8集中式训练的多智能体强化学习算法训练的智能体平均奖励曲线

图9分布式训练的多智能体强化学习算法训练的智能体平均奖励曲线

5 结论

声明:公众号转载的文章及图片出于非商业性的教育和科研目的供大家参考和探讨，并不意味着支持其观点或证实其内容的真实性。版权归原作者所有，如转载稿涉及版权等问题，请立即联系我们删除。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/570702.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

PyTorch-DataLoader

PyTorch-DataLoader

DataLoader：从Dataset中取数据，怎么取，每次取多少可以由DataLoader中的参数进行设定，并将数据加载到神经网络中。 dataloader.py import torchvision from torch.utils.data import DataLoader from torch.utils.tensorboard im…

阅读更多...

Python框架比较：Django、Flask和Pyramid三者的优缺点和应用场景

Python框架比较：Django、Flask和Pyramid三者的优缺点和应用场景

第一章：引言在当今快节奏的软件开发行业中，选择合适的开发框架对于开发人员来说至关重要。Python作为一种流行的编程语言，拥有众多强大的框架，其中包括Django、Flask和Pyramid。本文将比较这三个Python框架的优缺点和应用场景&a…

阅读更多...

企业级低代码开发，迈向企业数字化时代

企业级低代码开发，迈向企业数字化时代

当下，随着科技的快速发展，软件开发的成本不断降低，越来越多的人可以参与到软件开发的过程中。但是在这个过程中，我们也发现了一个问题，就是软件开发的成本越来越高。传统的开发模式需要投入大量人力物力，而…

阅读更多...

旅游信息推荐系统

旅游信息推荐系统

文章目录旅游信息推荐系统一、系统演示二、项目介绍三、系统运行界面图四、系统部分功能截图五、部分代码展示六、底部获取源码旅游信息推荐系统一、系统演示旅游信息推荐系统二、项目介绍数据库版本： mysql8.0 数据库可视化工具： navicat 服务器…

阅读更多...

新技术越来越多，作为程序员，我们应该怎么规划职业生涯？ | 社区征文

新技术越来越多，作为程序员，我们应该怎么规划职业生涯？ | 社区征文

随着科技的不断进步，新技术不断涌现，对程序员的要求也在不断提高。作为一名程序员，要想在这个竞争激烈的行业中立足，就需要制定一份明确的职业规划，不断学习和掌握新技术，提升自己的职业能力和竞争力。确定…

阅读更多...

自古以来，反射也是兵家必争之地

自古以来，反射也是兵家必争之地

成文耗时1小时，阅读5min，有用指数5颗星。这几天收到一个战术性需求，将一大坨字段序列化为特定格式的字符串。大概是下表： 序号字段名描述是否必填0logVersion日志版本是1productName产品是2serviceName服务是.........25extend3…

阅读更多...

手写Spring源码（简化版）

手写Spring源码（简化版）

导航： 【Java笔记踩坑汇总】Java基础进阶JavaWebSSMSpringBoot瑞吉外卖SpringCloud黑马旅游谷粒商城学成在线MySQL高级篇设计模式牛客面试题参考视频： 周瑜大都督手写模拟Spring_哔哩哔哩源码： https://gitee.com/vincewm/spring-master 目…

阅读更多...

windows自动保存git密码

windows自动保存git密码

Windows平台在使用Git的时候经常会出现反复输入密码，生成密钥对的时候如果设置了密码，那么每次使用时都会要求输入密码，那可以通过下面的方式解决。 1. 配置ssh自动启动管理员启动终端 Set-Service ssh-agent -StartupType Auto # 设置为…

阅读更多...

C语言实现分数求和

C语言实现分数求和

代码： // 计算1/1 - 1/2 1/3 - 1/4 ...1/99 - 1/100的值 // 计算1/1 - 1/2 1/3 - 1/4 ...1/99 - 1/100的值 int main() {int i 0;double sum 0.0;int flag 1;for (i 1; i < 100; i) {sum sum flag*(1.0 / i);flag -flag;}printf("%lf\n", su…

阅读更多...

java从入门到精通读这些书就够了

java从入门到精通读这些书就够了

阅读更多...

Caffeine 本地高速缓存工具类

目录 Caffeine工具类方式 SpringBoot 整合 Caffeine 缓存 （SpringCache模式） 驱逐策略开发使用 Caffeine是一种高性能的缓存库，是基于Java 8的最佳（最优）缓存框架，性能各方面优于guava。 Caffeine工具…

阅读更多...

脉蜂：Django + Flutter 开发的进销存管理系统【已开源】

脉蜂：Django + Flutter 开发的进销存管理系统【已开源】

项目说明小规模零售（包括电商）跟大规模零售企业的差别在哪里呢？ 以我当前的认知来看，小规模零售跟大规模零售企业的差别更多的是在供应链管理、进销存管控上面产生的。如果有一个工具，能够帮他们减少这方面的差异&…

阅读更多...

我们拆了一款Tof+AI避障的扫地机，小米铁蛋铁大机器人同款

我们拆了一款Tof+AI避障的扫地机，小米铁蛋铁大机器人同款

追觅W10 Pro是2022年初推出的新品，相较前一代W10，两者间最大的区别是将LDS避障升级为了TofAI避障，扫地机本体前脸像给W10开了“大眼特效”的传感器和摄像头就是机械避障升级的最佳佐证。在外观上扫地机还是延续了以往的设计，顶部…

阅读更多...

ReactRouterDom-v5v6用法与异同

ReactRouterDom-v5v6用法与异同

本文作者系360奇舞团前端开发工程师简介： React Router Dom是React.js中用于实现路由功能的常用库。在React应用中，路由可以帮助我们管理页面之间的导航和状态，并实现动态加载组件。本文将深入探讨React Router Dom的两个主要版本&#xff1…

阅读更多...

一文学会iOS画中画浮窗

一文学会iOS画中画浮窗

本文字数：11934字预计阅读时间：40分钟背景之前有看到有人用画中画实现时分秒的计时，顺手收藏了，一直没来及看。最近使用《每日英语听力》，突然发现它用画中画实现了听力语句的显示，顿时来了兴趣&#xf…

阅读更多...

超线程技术

超线程技术

超线程（HT, Hyper-Threading）是英特尔研发的一种技术，于2002年发布。超线程技术原先只应用于Xeon 处理器中，当时称为“Super-Threading”。之后陆续应用在Pentium 4 HT中。早期代号为Jackson。 [1] 通过此技术，英特尔实…

阅读更多...

Golang每日一练(leetDay0077) 存在重复元素、天际线问题

Golang每日一练(leetDay0077) 存在重复元素、天际线问题

目录 217. 存在重复元素 Contains Duplicate 🌟 218. 天际线问题 The Skyline Problem 🌟🌟🌟 🌟 每日一练刷题专栏 🌟 Rust每日一练专栏 Golang每日一练专栏 Python每日一练专栏 C/C每日一练 …

阅读更多...

PyTorch-torchvision

PyTorch-torchvision

1. 以Torchvision中的CIFAR10为例 dataset.py Ps：如果是从其他地方下载的gz文件，直接建立一个dataset文件夹然后将gz文件放进去，再运行。 import torchvisiontrain_set torchvision.datasets.CIFAR10(root"./dataset", trainTr…

阅读更多...

SpringCloud Alibaba Nacos

SpringCloud Alibaba Nacos

SpringCloud Alibaba Nacos Nacos 基础 1 官网 1.1 https://github.com/alibaba/Nacos 2 Nacos 是什么？ 2.1 一句话: Nacos 就是注册中心[替代Eureka]配置中心[替代Config] 2.2 Nacos：Dynamic Naming and Configuration Service 2.3 Nacos&#xff…

阅读更多...

数据结构---二叉树（C语言）

数据结构---二叉树（C语言）

二叉树 1. 二叉树1.1 二叉树的遍历1.1.1二叉树前中后序遍历（递归版）1.1.2 层序遍历 1.2 二叉树的其他相关接口1.2.1 求二叉树的结点数量1.2.2 求叶子结点个数1.2.3 求树高1.2.4 求第k层结点个数1.2.5 查找二叉树值为k的结点 1. 二叉树空树非空&#xff…

阅读更多...

推荐文章

最新文章