大语言模型驱动的智能体在开放世界中的终身学习:以Voyager玩转《我的世界》为例

news2026/4/30 4:47:18
1. 项目概述当大语言模型“学会”玩《我的世界》如果你关注AI领域尤其是具身智能和智能体Agent的发展那么“MineDojo/Voyager”这个项目绝对值得你花时间深入研究。这不仅仅是一个让AI玩《我的世界》Minecraft的趣味实验它代表了当前大语言模型LLM与复杂、开放世界环境交互的前沿探索。简单来说Voyager是一个由大语言模型驱动的、能够在《我的世界》中实现终身自主学习的智能体。它不需要人类手把手教它如何砍树、挖矿、建造房子而是通过与环境互动、从错误中学习、并自我扩展技能库最终实现从零开始探索、生存甚至创造复杂建筑的长期目标。我第一次看到这个项目时就被其“终身学习”和“技能库”的概念深深吸引。在传统的强化学习或模仿学习框架下智能体通常被训练来完成某个特定任务比如走到某个坐标点。一旦环境或目标稍有变化智能体就可能“傻眼”。而Voyager的设计理念完全不同它利用GPT-4这样的强大语言模型作为“大脑”将游戏世界中的感知屏幕像素、物品栏、生命值等转化为文本描述然后由“大脑”规划下一步行动并将成功的行动序列沉淀为可复用的“技能”。这个过程就像一个永不疲倦的玩家在不断试错中变得越来越强大。这个项目由加州大学伯克利分校的MineDojo团队推出其核心价值在于为构建能够在开放、不确定环境中长期自主生存和学习的通用智能体提供了一个极具启发性的技术框架和验证平台。2. 核心架构与工作流程拆解要理解Voyager的强大之处我们必须深入其内部看看这个“AI玩家”是如何思考和行动的。它的架构可以清晰地分为三个核心循环感知与规划循环、技能库构建循环、以及环境交互与迭代循环。这三个循环紧密协作构成了Voyager自主学习的引擎。2.1 三层核心循环的协同机制首先感知与规划循环是Voyager的“瞬时反应系统”。智能体每时每刻都在接收来自游戏环境的信息一个简化的文本化观察例如“你站在一片橡木林中面前有一棵橡树。你的物品栏里有1个木镐。生命值20/20饥饿值19/20”。这个观察会被送入一个提示工程精心设计的“规划模块”该模块的核心是一个大语言模型如GPT-4。提示词会要求模型基于当前观察、长期目标如“获得钻石”和已有的技能库生成下一步的具体行动指令。这个指令不是模糊的“去挖矿”而是精确的、游戏可执行的代码比如“向前移动3格然后使用木镐挖掘面前的橡木原木”。其次技能库构建循环是Voyager的“长期记忆与经验沉淀系统”。这是Voyager区别于传统智能体的关键。每当规划模块生成的一系列行动代码成功完成了一个有意义的子任务比如成功合成了一张工作台这个成功的代码序列连同其目标描述“合成工作台”和触发条件“当物品栏中有4块橡木木板时”就会被封装成一个“技能”存入一个不断增长的技能库中。这个技能库本质上是一个可检索的代码函数库。未来当智能体再次遇到类似情境比如需要合成熔炉也需要木板它就可以直接调用“合成工作台”技能中的相关代码逻辑或者将其作为新规划的基础而无需从头开始“思考”。这极大地提高了效率并实现了知识的积累和复用。最后环境交互与迭代循环是Voyager的“试错与学习系统”。规划出的代码会被执行环境会给出新的状态和结果比如成功挖到原木或者因为工具不对而挖掘失败。这个结果会作为反馈连同之前的观察和行动一起被记录并用于后续的规划。如果行动失败智能体会分析原因通过LLM调整策略并再次尝试。这个过程不断重复驱动着智能体探索未知区域、尝试新配方、应对突发威胁如夜晚的怪物。注意这三个循环并非完全串行。在实践中它们是高度交织的。一次成功的规划与执行可能立刻催生一个新技能构建循环而这个新技能又会影响下一时刻的规划规划循环整个过程在持续的环境交互中推进。2.2 关键技术组件深度解析理解了循环我们再看看支撑这些循环运转的具体组件。环境感知与文本化World-to-Text这是将《我的世界》这个丰富的3D像素世界转化为LLM能理解的文本的关键一步。Voyager并非处理原始的图像像素而是利用Minecraft的模组Mod或API如MineDojo自研的环境提取结构化的游戏信息生物群系类型、视线范围内的方块列表、实体动物、怪物信息、物品栏内容、生命值、饥饿值、合成配方书状态等。这些信息被组织成一段简洁、格式化的自然语言描述作为LLM的输入。这一步的优劣直接决定了LLM对世界理解的准确性。提示工程与行动代码生成这是LLM发挥核心作用的环节。给LLM的提示Prompt是精心设计的通常包括系统角色设定例如“你是一个在Minecraft中生存的AI智能体”。当前环境观察即上述文本化描述。长期目标如“在1000步内获得一颗钻石”。可用技能库清单列出已学技能的名称和简要描述。行动格式规范严格要求LLM以特定格式如Python函数调用或一组游戏指令输出。例如输出必须是move(‘forward’, 3)或craft(‘planks’, 4)这样的可解析代码。历史上下文可能包含最近几步的成功或失败经历帮助模型进行纠错。 通过这样的提示LLM扮演了一个既能理解复杂目标又能生成具体、可执行代码的“规划师”和“程序员”角色。技能库的抽象、存储与检索技能库不是一个简单的日志。每个技能包含技能名称描述性名称如“mine_wood_with_stone_axe”。代码实现实现该技能的一系列函数或指令。描述自然语言描述该技能的功能。前提条件执行该技能前必须满足的环境状态如“物品栏中必须有石斧”。后置条件执行成功后预计会改变的环境状态如“物品栏中橡木原木数量增加”。 当面临新任务时Voyager会通过向量检索或关键词匹配从技能库中寻找最相关的已有技能作为新规划的起点或组件。这实现了“举一反三”的能力。代码执行与安全沙箱生成的代码通常是JavaScript或Python会在一个与《我的世界》游戏客户端通信的沙箱环境中执行。这个沙箱环境至关重要它需要隔离性防止错误的代码破坏主程序或系统。容错性能够捕获运行时错误如尝试挖掘一个无法挖掘的方块并将错误信息作为反馈返回给规划循环。效率执行需要足够快以保持交互的实时性。3. 实操搭建与核心配置要点虽然直接复现Voyager的完整实验需要大量的计算资源特别是频繁调用GPT-4 API但我们可以搭建一个简化版的环境理解其核心链路甚至尝试用较小的开源模型进行概念验证。以下是基于开源代码和现有工具链的实操路径。3.1 基础环境搭建与依赖安装首先你需要一个可编程的《我的世界》环境。推荐使用MineDojo框架它专门为AI研究设计提供了丰富的API和文本化界面。环境准备操作系统Linux (Ubuntu 20.04) 或 macOS。Windows可通过WSL2进行。Python版本 3.8 或 3.9。Java安装 Java 8 或 11用于运行Minecraft服务器。Git用于克隆代码库。安装 MineDojo# 克隆 MineDojo 仓库 git clone https://github.com/MineDojo/MineDojo.git cd MineDojo # 创建并激活 Python 虚拟环境强烈推荐 python -m venv venv source venv/bin/activate # Linux/macOS # 或 venv\Scripts\activate # Windows # 安装依赖 pip install -e .安装过程可能会自动下载必要的Minecraft客户端和资源文件请保持网络通畅。安装 Voyager 相关代码 通常Voyager的代码会作为一个示例或子项目提供。你需要找到并安装其特定依赖。# 假设 Voyager 代码在 MineDojo 的 examples/voyager 目录下 cd examples/voyager pip install -r requirements.txt3.2 核心配置文件解析与修改Voyager的行为由一系列配置文件控制。理解并调整这些文件是关键。模型配置 (configs/model_config.yaml)llm: model_name: gpt-4 # 或 gpt-3.5-turbo, claude-3-haiku api_key: ${OPENAI_API_KEY} # 从环境变量读取 temperature: 0.1 # 低温度保证输出确定性高适合生成代码 max_tokens: 1024关键点temperature设置较低如0.1-0.3因为代码生成需要精确性而非创造性。如果你使用开源模型如CodeLlama、DeepSeek-Coder则需要配置本地API端点。环境配置 (configs/env_config.yaml)minecraft: server_port: 25565 observation_space: text # 使用文本化观察而非RGB图像 allowed_actions: [move, turn, break, place, craft, smelt] # 定义智能体可执行的动作集 world_seed: 42 # 固定种子保证实验可复现关键点observation_space设为”text”是Voyager工作的基础。allowed_actions定义了动作空间的大小开始时可以限制得小一些降低规划难度。智能体配置 (configs/agent_config.yaml)voyager: skill_library_size: 100 # 技能库最大容量 skill_retrieval_top_k: 3 # 每次规划时检索最相关的3个技能 max_retry_attempts: 3 # 单个动作失败后的重试次数 reflection_enabled: true # 是否启用“反思”机制即失败后分析原因 curriculum_learning: # 课程学习设置 enabled: true stages: [collect_wood, craft_tools, mine_stone, find_cave]关键点reflection_enabled是重要的高级功能。当行动失败LLM会被要求分析“为什么失败”以及“如何修正”这能显著加速学习。curriculum_learning将漫长的“获得钻石”目标分解为一系列循序渐进的子目标引导智能体学习。3.3 运行第一个智能体并观察日志配置完成后你可以启动一个简单的运行脚本。python run_voyager.py --config-path ./configs/ --goal “Craft a wooden pickaxe”启动后密切观察控制台日志。你会看到类似以下的输出流这是理解智能体思考过程的最佳窗口[Observation]: 你出生在一片森林中。周围有橡树。物品栏为空。生命值20。 [Thought]: 目标制作木镐。需要木板和木棍。首先需要获得原木。 [Action Generated]: 代码move_to_nearest(“oak_tree”); for(i0;i4;i){break_block(“oak_log”)} [Execution]: 执行成功。获得橡木原木x4。 [Skill Generated]: 新技能 ‘chop_oak_log’ 已保存至技能库。 [New Observation]: 物品栏中有橡木原木x4。 [Thought]: 现在可以将原木合成为木板。 [Action Generated]: 调用技能 ‘craft_planks_from_log’ (从技能库检索)。 [Execution]: 执行成功。获得橡木木板x16。 ...通过日志你可以清晰地看到“观察-思考-行动-学习”的完整循环。初期智能体可能会犯一些可笑的错误比如试图空手挖掘石头但通过反思机制它会很快学习到需要正确的工具。4. 性能优化与高级技巧在基础跑通之后如何让你的Voyager智能体更聪明、更高效、成本更低以下是一些来自实践的经验和高级技巧。4.1 提示工程优化让LLM更好地理解世界默认的提示词可能不够精准。你可以根据观察到的常见错误进行微调。问题LLM经常生成不可能的动作如“一次合成64个木板”工作台一次最多合成4个。优化在系统提示中加入明确的游戏规则约束“你生成的代码必须严格遵守Minecraft的游戏规则1. 工作台一次合成操作最多处理一个配方如4个原木-4个木板。2. 熔炼需要燃料和时间。3. 工具具有耐久度。请在代码注释中简要说明你遵守了哪条规则。”问题LLM忽视长期目标陷入短期循环。优化在每次提示中不仅给出当前目标还以清单形式列出后续目标链“当前主要目标获得一个石镐。达成此目标后的预期下一个目标寻找煤矿。请确保你的行动有利于最终获得钻石。”4.2 技能库的维护与进化策略技能库不能只增不减需要维护。技能去重与合并定期检查技能库。如果两个技能功能高度相似如mine_wood_1和chop_tree_2可以设计一个合并算法或用LLM判断是否可合并保留更通用、健壮的那个。技能泛化一个在“橡木林”中学到的砍树技能能否应用到“杉木林”可以在技能描述和前提条件中用更抽象的术语如“树木”代替“橡树”并在检索时使用语义相似度而非精确匹配。设置技能优先级为技能打上成功率和调用频率的标签。在规划时优先选择高成功率、高频使用的技能作为基础。4.3 成本控制使用小型或本地模型GPT-4的API调用成本对于长期实验是巨大的。可以考虑以下策略分层模型策略让一个较小的、快速的模型如GPT-3.5-Turbo或Claude Haiku负责常规的规划和代码生成。只有当任务特别复杂或小模型多次失败时才调用GPT-4进行“专家会诊”。这可以节省大部分成本。转向开源模型使用在代码和指令跟随上表现优秀的开源模型如DeepSeek-Coder、CodeLlama或Qwen2.5-Coder。你需要搭建一个本地推理服务使用vLLM、Ollama等框架然后将配置中的API端点指向本地服务。虽然效果可能略逊于GPT-4但对于原理研究和许多任务已足够。缓存与复用对相同的观察状态和目标的规划结果进行缓存。如果智能体再次遇到完全相同的情境直接使用缓存结果无需再次调用LLM。4.4 引入人类反馈与课程设计纯自主探索可能效率低下。可以引入微弱的人类反馈进行引导。关键节点干预当智能体长时间卡在某个环节比如找不到煤矿你可以通过修改环境在附近生成一个煤矿脉或直接通过提示词给予暗示“尝试往地下深处挖掘”来引导它。设计更合理的课程默认的课程收集木头-制作工具-挖石头…是通用的。你可以为特定终极目标设计更优的课程。例如目标是“建造一个自动农场”那么课程可能变为收集木头-制作工具-寻找水源-开垦土地-寻找种子-制作骨粉-设计红石电路如果智能体水平足够。好的课程能极大加速学习进程。5. 常见问题排查与实战心得在实际操作中你一定会遇到各种问题。下面是我在实验过程中遇到的一些典型问题及解决方案。5.1 环境与连接问题问题现象可能原因解决方案启动时提示“Java版本不兼容”或“Minecraft服务器启动失败”。系统未安装Java或Java版本不对需要Java 8或11。使用java -version检查。安装正确的Java版本如OpenJDK 11并确保其在系统PATH中。智能体无法连接Minecraft服务器日志显示连接超时。1. Minecraft服务器未成功启动。2. 防火墙阻止了端口默认25565。3. 客户端/服务器版本不匹配。1. 检查MineDojo日志确认服务器启动进程无报错。2. 临时关闭防火墙或添加端口规则。3. 确保MineDojo使用的Minecraft客户端版本与服务器版本一致。观察信息返回为空白或NULL。游戏模组Mod加载失败或文本化提取器Vectorizer工作异常。重新安装MineDojo依赖确保安装过程完整下载了所有资源。检查minecraft/目录下的mods文件夹是否完整。5.2 智能体行为异常问题问题现象可能原因解决方案LLM生成的代码语法错误无法执行。1. 提示词中对输出格式的约束不够强。2. LLM的temperature参数过高输出随机性大。3. 上下文长度不足导致输出被截断。1. 强化提示词格式使用更严格的示例Few-Shot Prompting。2. 将temperature降至0.1。3. 增加max_tokens或简化观察文本以减少输入长度。智能体在原地打转或重复执行无效动作。1. 观察信息不完整缺少关键信息如坐标。2. 技能库检索失败无法利用历史经验。3. 目标设定过于模糊。1. 检查环境配置确保观察信息包含智能体的绝对/相对坐标和朝向。2. 检查技能检索逻辑打印出检索到的技能列表进行调试。3. 将目标拆解得更具体、可衡量如“走到坐标(x10, y64, z-5)处”。技能库增长缓慢智能体每次都从头规划。1. 技能保存的条件太苛刻只有完全成功才保存。2. 技能检索的相似度阈值设置过高匹配不到近似技能。1. 允许部分成功的动作序列也作为“经验片段”存入技能库并加上成功率的标签。2. 降低检索阈值或采用更灵活的语义检索如使用句子嵌入模型。5.3 资源与性能问题问题现象可能原因解决方案API调用费用飙升。1. 智能体陷入失败循环频繁重试导致大量API调用。2. 反思Reflection机制过于频繁每次失败都调用LLM分析。1. 设置单次任务的最大尝试次数上限如10次超过后强制终止或切换任务。2. 为反思机制设置冷却时间或失败计数器并非每次失败都触发深度反思。运行速度慢一步需要数十秒。1. API网络延迟高特别是使用海外服务。2. 游戏环境帧率FPS或刻Tick速度慢。3. 代码沙箱执行效率低。1. 考虑使用本地模型或为云端API配置代理优化网络。2. 在Minecraft服务器设置中降低视图距离等图形设置或使用无头模式Headless。3. 审查生成的代码避免复杂的循环或冗余操作优化执行脚本。我个人在实验中最深刻的体会是提示词的质量决定了智能体行为的下限而技能库的设计则决定了其能力上限。初期我花费了大量时间在调整提示词上以纠正LLM各种“匪夷所思”的规划比如试图用水桶装岩浆来合成黑曜石。一旦提示词相对稳定智能体能执行基本操作后重点就应该转移到如何让技能库更好地沉淀和复用知识上。一个有效的技巧是定期“回放”技能库中的技能在简单环境中测试它们是否仍然有效并手动优化那些冗长或脆弱的技能代码。这就像是在为你的AI伙伴整理和更新它的“武功秘籍”虽然需要一些人工介入但能换来长期执行效率的成倍提升。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2555057.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…