kNN×KDE算法:基于相似性的数据填补原理与天文数据应用

news2026/5/24 9:02:56
1. 项目概述当系外行星数据遇上“最像的邻居”在系外行星学这个领域我们每天都在和数据“捉迷藏”。想象一下你手里有一本记录了数千颗系外行星的“花名册”但翻开一看很多关键信息栏是空白的这颗行星质量是多少半径多大轨道偏心率呢这种数据缺失在观测天文学中几乎是常态因为不同的探测方法凌星法、径向速度法各有侧重能获取的信息维度天然不同。这就导致了一个尴尬的局面我们发现了海量的行星但能完整描绘其物理肖像的却寥寥无几。没有完整的数据我们就很难回答一些根本性问题比如行星的总体分布规律、不同族群的形成机制有何差异。传统的处理方式要么是忍痛割爱只分析那些数据完整的样本这无疑浪费了大量宝贵的发现要么是用一些简单的统计值如均值、中位数粗暴填充这又会引入偏差扭曲数据本来的结构。我们需要一种更聪明的方法能够基于已知的、不完整的数据集合理地“猜出”那些缺失的值。这就是数据填补Data Imputation技术的用武之地。它不是一个简单的“填空”游戏而是一种基于数据内在关联和相似性进行概率推断的科学方法。我这次要深入探讨的是一种结合了k近邻k-Nearest Neighbors, kNN和核密度估计Kernel Density Estimation, KDE的算法我们称之为kNN×KDE。它的核心思想非常直观在茫茫星海中要估算一颗“信息不全”的行星A的缺失属性比如质量我们就去找那些已知所有属性的、和A最相似的“邻居”行星们。这些邻居的已知质量值就为我们提供了A可能质量的一个概率分布。kNN负责找到这些邻居KDE则负责将这个“邻居意见”平滑成一个连续的概率分布而不是一个孤零零的单一数值。这种方法最大的优势在于它给出的不是一个“标准答案”而是一个“可能性范围”这更符合科学探索中不确定性无处不在的现实。2. 算法核心kNN×KDE如何“以邻为鉴”2.1 算法流程拆解从相似性到概率分布kNN×KDE算法的工作流程可以清晰地分为三步每一步都蕴含着关键的设计考量。第一步定义“相似性”并寻找邻居这是整个算法的基石。我们手头的数据集每颗行星都由多个属性特征描述例如轨道周期、平衡温度、恒星质量、系统内行星数量等。对于一颗目标行星其部分属性缺失我们需要在参数空间一个多维空间每个维度代表一个属性中找到与它最相似的k颗行星通常k20。这里的“相似性”通过距离来衡量最常用的是欧几里得距离。但这里有一个至关重要的预处理步骤标准化。因为不同属性的量纲和数值范围差异巨大例如轨道周期以天为单位可能从0.几天到几万天而金属丰度是以对数表示的微小数值如果不进行标准化数值大的属性如周期将在距离计算中占据绝对主导导致“相似性”失真。因此我们必须先将所有属性标准化到均值为0、方差为1的尺度上确保每个维度在寻找邻居时拥有同等的话语权。第二步基于邻居进行加权核密度估计找到k个最近邻后传统kNN可能直接取这些邻居对应属性值的平均值或中位数作为填补值。但kNN×KDE更进了一步。它认为不同的邻居“发言权”应该不同距离目标行星越近的邻居其属性值应该对估算的贡献越大。因此算法会根据每个邻居与目标的距离计算一个权重距离越近权重越高。然后它使用这些带权重的邻居的属性值构建一个核密度估计KDE。你可以把KDE想象成在每个邻居的属性值位置上点一盏灯灯的亮度核函数通常用高斯函数和邻居的权重有关距离目标值越近的灯贡献的光越强。最后把所有灯的光叠加起来就形成了一条光滑的概率密度曲线。这条曲线峰值对应的属性值就是最可能的填补值而曲线的宽度则反映了估算的不确定性。第三步与先验信息结合可选但关键在天文观测中我们有时对缺失值有一个粗略的、带有不确定性的测量。例如在径向速度观测中我们得到的是行星质量的最小值M sin i而非真实质量。kNN×KDE算法可以巧妙地将第一步得到的概率分布基于相似性与这个先验测量值的概率分布通常建模为一个高斯分布进行卷积。这相当于让“邻居们的集体意见”和“观测给出的模糊线索”进行了一次对话和融合最终得到一个更准确、更紧致的后验概率分布。这个过程在贝叶斯统计框架下非常自然极大地提升了在有限先验信息下的估算精度。2.2 关键参数与设计选择k值的选择k的大小是一个权衡。k太小如k3估算结果对噪声和异常值非常敏感不稳定k太大可能会把一些其实不那么相似的“远亲”也包含进来导致估算结果被无关群体“带偏”模糊了局部结构。在系外行星参数空间中由于分布不均匀例如热木星非常集中而长周期巨行星很稀疏一个固定的k值可能并不普适。在稀疏区域可能只有两三个真正相似的邻居强行找20个会导致引入大量不相关样本。因此一个更高级的实现可能会考虑自适应k值或者像原文中提到的允许为某些缺失属性选择邻居时放松对其他缺失属性的要求。距离度量与权重函数欧几里得距离是默认选择但在高维空间中可能失效“维度灾难”。马哈拉诺比斯距离能考虑属性间的相关性但计算更复杂。权重函数通常选择距离的倒数或高斯核函数核心原则是确保近邻主导。核函数带宽这是KDE的核心参数决定了每个“数据点灯光”的晕染范围。带宽太大概率分布过于平滑会丢失细节带宽太小分布会显得崎岖不平对噪声敏感。通常使用“斯科特规则”或“西尔弗曼规则”这类自适应方法来确定最佳带宽。实操心得在实现时数据标准化这一步千万不能省。我曾试过跳过这一步直接计算距离结果算法完全被轨道周期这一个特征“绑架”找出的邻居毫无意义。另外对于k值不要迷信默认值。最好能针对你的特定数据集在一个验证集上将部分已知值人为隐藏后再预测测试不同k值比如5, 10, 20, 50的表现选择平均误差最小的那个。3. 实战演练在系外行星数据上的应用与评估3.1 数据集构建与实验设计我们的“战场”是NASA系外行星档案。原始数据是高度不完整的。我们构建了三个层次的数据集来检验算法完整属性数据集只包含所有6个核心属性行星质量、半径、轨道周期、平衡温度、恒星质量、系统行星数都齐全的行星。这是传统方法能用的“干净”数据但样本量小。全档案数据集包含所有已发现行星允许核心属性缺失。这才是真实场景数据量剧增但稀疏性也大大增加。扩展数据集在全档案数据集基础上加入了两个虽然记录不全但可能提供重要信息的属性——轨道偏心率和恒星金属丰度。评估采用“留出法”进行反测试对于数据集中质量已知的行星我们假装不知道它的质量用算法去估算然后将估算结果与真实值比较。用平均绝对误差或原文中的ε误差来衡量整体精度。同时我们模拟两种典型的观测场景凌星观测场景已知半径、周期等但质量缺失凌星法只能测半径。算法需估算质量。径向速度观测场景已知质量最小值M sin i其他属性可能缺失。算法需估算真实质量和半径。3.2 核心案例深度解析原文提供了几个极具代表性的案例生动展示了算法在复杂情况下的表现。我们来深入剖析一下案例一天王星——稀疏区域的“幸运儿”天王星在我们的太阳系中但在系外行星的参数空间里它是个异类轨道周期极长约84年平衡温度极低。在仅使用6个属性的数据集中它处于非常稀疏的区域。然而kNN×KDE却成功预测了其质量。秘诀在于加权机制。虽然算法需要找20个邻居但其中海王星在参数空间里与天王星非常接近因此获得了极高的权重。其他19个邻居可能五花八门但由于权重很低它们对最终概率分布的贡献微乎其微。最终的概率分布峰值紧紧环绕在真实质量附近。这证明了在数据稀疏区加权kNN比简单平均更有效它能牢牢抓住那一两个真正相似的样本避免被大量不相似样本“稀释”掉信号。案例二WASP-110b——族群力量的体现这是一颗典型的热木星质量介于木星和土星之间轨道周期短。尽管它的数据也不完整缺少恒星质量和平衡温度但热木星这个族群在参数空间中形成了一个密集的集群。这意味着即使只用部分属性如周期、单行星系统算法也能轻松找到一大群属性相似的热木星邻居。这些邻居的质量和半径值非常集中因此算法给出的概率分布非常窄峰值准确。这展示了当目标行星属于一个定义明确且数据丰富的群体时算法的表现会非常稳健和准确。案例三TIC 172900988 b——复杂系统的挑战这颗行星的案例非常有趣。它围绕一个双星系统运行且其真实质量由于轨道解的不确定性而有一个范围824-981 M⊕。算法面临的挑战是双星系统在档案中很少因此“宿主恒星数量”这个属性未被纳入其平衡温度随时间变化也难以使用。尽管有这些不利因素算法仅凭其他属性估算出的质量和半径其概率分布的峰值依然落在了观测值的范围内。这说明了算法作为一种独立的估算工具可以与动力学拟合等其他方法相互印证共同约束行星属性降低不确定性。案例四14 Her b与Kepler-51d——新属性如何打破僵局当引入轨道偏心率和恒星金属丰度后发生了神奇的变化。14 Her b是一颗长周期、高偏心率e0.37的气态巨行星。在6属性数据集中由于缺乏半径信息算法找到的邻居既包含巨行星也包含超级地球导致了一个双峰的概率分布无法确定。加入偏心率后高偏心率与高质量行星的强相关性参见原文图2的相关性分析立即发挥作用算法迅速将概率权重偏向气态巨行星那个峰歧义被打破。Kepler-51d情况类似其低金属丰度的恒星环境更倾向于拥有低质量行星结合其他信息算法从原本宽泛的分布变成了一个集中在几个地球质量的尖峰。这两个案例强有力地证明了引入具有物理判别力的新属性即使它们本身不完备也能显著提升算法在模糊案例中的决策能力。案例五HD 145934 b与K2-132b——新属性也可能“帮倒忙”然而新属性并非总是“助攻”。HD 145934 b也是一颗长周期巨行星但它的偏心率很低。在6属性数据集中算法很确信它是巨行星。但加入低偏心率信息后由于低偏心率也与低质量行星相关算法开始犹豫概率分布又出现了巨行星和超级地球的双峰。K2-132b则是一颗轨道周期极短小于1天的膨胀热木星但它具有异常高的偏心率。在6属性集中它在密集的热木星区域估算很准。加入高偏心率后算法倾向于寻找其他高偏心率行星作为邻居而这些邻居往往质量更大导致估算值偏高。后经分析它的高偏心率可能源于其宿主恒星演化产生的潮汐效应是一个特殊案例。这两个案例提醒我们加入属性需谨慎。如果新属性与目标属性如质量的物理关联性不强或者目标本身是特殊案例偏离普遍规律那么新属性可能引入噪声或误导。所有属性在kNN×KDE中被平等加权不相关属性的加入会稀释重要属性的影响力。3.3 评估结果汇总与洞见将上述案例的微观分析与整体误差的宏观变化结合我们可以得出以下核心结论利用不完整数据价值巨大从“完整属性集”到“全档案数据集”虽然数据变得稀疏嘈杂但整体质量估算误差并未显著恶化反而因为样本量剧增许多在小子集中显得“另类”的行星找到了更多相似伙伴估算更准。这证明了最大化利用所有观测数据的策略是有效的。引入判别性属性可提升精度从6属性的“全档案数据集”到8属性的“扩展数据集”整体平均误差ε出现了小幅但明确的下降例如凌星场景下从1.510降至1.502。这说明轨道偏心率和恒星金属丰度这两个属性从整体统计上看为质量估算提供了额外的、有价值的信息。算法提供的是概率而非定论kNN×KDE输出的概率分布本身富含信息。一个宽泛的双峰分布如14 Her b在6属性下的结果明确告诉我们“现有数据无法很好区分这两种可能性”。这比给出一个错误的单一值更有科学价值它量化了不确定性并指导我们需要何种进一步的观测例如测一下偏心率就能解决歧义。没有放之四海而皆准的模型算法的表现高度依赖于数据在参数空间中的分布结构。在密集、同质的群体中如热木星它表现优异在稀疏区域或边界案例中表现取决于是否有真正相似的近邻对于因特殊物理过程而偏离主流的“异常值”算法可能被普遍规律误导。4. 超越填补生成合成数据与行星分类探索kNN×KDE的能力不止于填补缺失值。由于它能生成完整的概率分布我们可以将其作为一个生成模型从原始数据分布中合成出任意数量的、属性完整的“虚拟行星”。这些合成行星在统计特性上与原始数据保持一致。4.1 合成数据生成步骤对于原始数据集中的每一颗行星即使它属性不全算法都可以基于其已知属性为每个缺失属性生成一个概率分布。从这个分布中进行随机采样得到一个该属性的填补值。对所有缺失属性重复此过程即可得到一颗属性完整的合成行星。重复大量次数就能生成一个庞大的、完整的合成行星种群。4.2 t-SNE可视化与集群发现有了这个完整的合成数据集我就可以使用像t-SNEt-分布随机邻域嵌入这样的降维技术将高维参数空间映射到二维平面进行可视化。在原文的图14中清晰的集群结构显现出来最大的红色集群对应了占主导地位的超级地球/海王星亚恒星群体。它们半径小6 R⊕、轨道周期短、偏心率低。黄色和绿色集群可能对应了气态巨行星的不同子类例如热木星周期极短和周期更长的气态巨行星。边界上的橙色、紫色、蓝色集群这些可能是处于过渡状态的群体或者是由于某些属性如高偏心率、特殊恒星类型而形成的特殊子类。4.3 集群分析的科学意义这种数据驱动的集群划分虽然最初是统计意义上的但很可能对应着不同的行星形成或演化路径。例如短周期、低偏心率的小行星集群可能与盘内迁移理论相关而高偏心率的气态巨行星可能暗示了行星-行星散射事件。更重要的是这揭示了kNN×KDE算法工作的内在逻辑它之所以能进行填补正是因为它潜意识地在参数空间中寻找属于同一“集群”或“族群”的邻居。理解这些集群的结构反过来可以帮助我们优化算法例如为不同集群设置不同的k值或距离度量权重。5. 经验总结与避坑指南基于这项研究和实际经验以下是一些关键的实操建议和常见问题排查思路核心经验数据质量重于算法复杂度花80%的时间清洗、理解和探索你的数据。检查缺失模式是完全随机缺失还是与某些属性相关进行相关性分析哪些属性与目标属性强相关。这些分析直接决定了你该选择哪些属性进行填补以及如何解释结果。标准化是必须步骤在计算距离前务必对所有连续型特征进行标准化Z-score标准化或Min-Max标准化否则距离度量毫无意义。理解算法的输出是概率分布不要只取峰值或均值作为最终答案。仔细审视分布的形状是单峰尖锐高置信度是双峰存在歧义还是宽泛平坦不确定性很大这个分布本身就是重要的科学输出。新属性的引入要基于物理洞察不要盲目添加属性。像轨道偏心率、恒星金属丰度这样与行星形成演化理论紧密相关的属性往往是“强特征”。而一些无关或冗余的属性只会增加噪声和计算量。常见问题与排查问题算法对所有样本的估算结果都趋向于全局平均值缺乏区分度。排查首先检查是否忘记了数据标准化。其次k值可能设置得过大尝试减小k值。最后检查所选用的属性是否与目标属性真的相关如果都不相关算法自然无法做出有区分度的预测。问题估算结果误差极大明显不合理。排查目标样本可能是一个真正的“异常值”在参数空间中没有足够近的邻居。此时应检查该样本的已知属性是否极端并审视算法给出的概率分布是否非常宽泛。对于异常值任何填补方法都可能不可靠需要单独处理或注明其高度不确定性。问题加入新属性后整体误差反而上升。排查如HD 145934 b案例所示新属性可能在整体统计上有益但对某些特定子类有误导。检查误差增大的样本是否具有某种共同特征如特殊的偏心率、处于演化晚期的主星等。考虑是否需要对不同子群采用不同的属性集或者为属性赋予不同的权重这需要改进算法如使用加权距离或特征选择。问题在稀疏区域算法找到的“最近邻”实际上距离也很远。排查这是高维稀疏空间的固有难题。可以尝试a) 使用马哈拉诺比斯距离考虑特征相关性b) 采用自适应k值允许在稀疏区域使用更少的邻居c) 如原文所述允许算法在寻找邻居时忽略那些同样缺失的属性维度专注于共有的已知维度。最后记住kNN×KDE这类基于相似性的方法其根本假设是“相似的输入产生相似的输出”。在系外行星学中这个假设大体成立因为物理规律是普适的。但它无法捕捉那些罕见的、由特殊机制产生的“出格”案例。因此它永远应该是天文学家工具箱中的一件强大辅助工具而非替代物理建模和深入观测的“黑箱”。将数据驱动的填补结果与理论预期、其他观测手段相互校验才是推动我们更接近系外行星真相的正确路径。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2640364.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…