ClickHouse助力大数据高效存储与快速查询

news2026/3/24 10:45:53
ClickHouse助力大数据高效存储与快速查询关键词ClickHouse、列式存储、向量化执行、大数据查询、OLAP数据库摘要在数据量以指数级增长的今天传统数据库面临存不下、查得慢的双重挑战。ClickHouse作为专为大数据场景设计的列式数据库凭借其独特的技术架构能在PB级数据规模下实现毫秒级查询响应。本文将通过生活类比、技术原理解析、实战案例三大模块带您一步步理解ClickHouse的核心优势掌握用它解决大数据存储与查询难题的方法。背景介绍目的和范围本文旨在帮助开发者、数据工程师理解ClickHouse的核心技术原理掌握其在大数据场景中的应用方法。内容覆盖从基础概念到实战操作的全流程重点解析列式存储、向量化执行等关键技术以及如何通过ClickHouse优化亿级数据的存储与查询。预期读者希望优化数据查询性能的后端开发者负责企业大数据平台建设的数据工程师对新型数据库技术感兴趣的技术管理者文档结构概述本文将按照概念引入→原理解析→实战应用→趋势展望的逻辑展开首先用超市货架的生活案例引出列式存储的优势接着拆解ClickHouse的核心技术模块列式存储、向量化执行、并行处理然后通过电商订单数据分析的实战案例演示从环境搭建到复杂查询的完整流程最后总结应用场景并展望未来发展。术语表核心术语定义列式存储数据按列存储而非按行存储的技术如将所有用户ID存在一起所有订单金额存在一起向量化执行一次性处理一批数据如一次处理1000条记录而非逐条处理OLAP在线分析处理Online Analytical Processing侧重复杂统计查询稀疏索引只记录数据块的位置信息而非每条记录的索引相关概念解释行式存储传统数据库如MySQL的存储方式按行存储完整记录如一条订单的用户ID、金额、时间等字段连续存放数据压缩通过算法减少数据存储空间如将重复的2024-05-20日期值压缩存储分布式查询将查询任务拆分到多台服务器并行执行核心概念与联系故事引入超市理货的启示想象你经营一家大型超市每天有10万件商品需要上架。如果按照行式摆放——把每单购物车的商品可乐、薯片、纸巾依次摆成一排当需要统计本周卖了多少瓶可乐时你得从每一排中翻出可乐的位置逐个计数效率极低。但如果换成列式摆放——把所有可乐集中放在A区所有薯片放在B区所有纸巾放在C区。这时要统计可乐销量只需直接扫描A区的所有商品效率瞬间提升10倍ClickHouse的核心设计灵感就来自这种列式摆放的智慧。它把数据库中的列当作超市的商品区让大数据查询变得像超市理货一样高效。核心概念解释像给小学生讲故事一样核心概念一列式存储——数据的分类摆放传统数据库如MySQL存储数据时会把一条记录的所有字段比如用户ID、订单金额、下单时间像串冰糖葫芦一样串成一行。这种行式存储在需要查询某一列比如所有订单金额时必须把整行数据都读出来就像从一筐混装的水果里挑苹果效率很低。ClickHouse采用列式存储相当于把每个字段单独放进一个抽屉所有用户ID存在抽屉1所有订单金额存在抽屉2所有下单时间存在抽屉3。当需要查询订单金额大于100元的记录时只需要打开抽屉2订单金额列扫描其他抽屉用户ID、下单时间根本不用管就像从专门装苹果的抽屉里挑大苹果又快又省力气。核心概念二向量化执行——批量处理的快递装车术假设你要把1000个快递送到小区逐条处理就像一次只搬一个快递来来回回跑1000趟。向量化执行则像把1000个快递装进一辆货车一次性送完。ClickHouse的向量化执行引擎会把数据分成1000-65536条的数据块类似货车每次处理一个数据块而非单条记录。比如计算订单金额的平均值时引擎会一次性加载一个数据块的所有金额值用CPU的向量化指令如SIMD批量计算比逐条计算快10-100倍。核心概念三并行处理——多个人的流水线作业过年包饺子时如果只有妈妈一个人擀皮、包馅速度很慢。但如果爸爸擀皮、奶奶包馅、爷爷煮饺子三个人同时工作效率马上提升。ClickHouse的并行处理机制就像包饺子流水线当执行一个查询比如统计各地区订单量时会把数据分成多个分片相当于不同的饺子馅分配给多个CPU核心甚至多台服务器同时处理最后把结果汇总。对于PB级数据这种分而治之的方式能把查询时间从分钟级缩短到毫秒级。核心概念之间的关系用小学生能理解的比喻这三个核心概念就像三个默契的小搭档共同完成高效存储快速查询的任务列式存储→向量化执行列式存储把同一列的数据集中存放像把苹果集中放在一个箱子向量化执行就能一次性搬走整箱苹果处理一个数据块而不是逐个拿苹果逐条处理。向量化执行→并行处理向量化处理的数据块一箱苹果可以分给多个工人CPU核心同时搬运计算就像把一箱苹果拆成几小箱多个人一起搬得更快。列式存储并行处理列式存储让每个列的数据独立苹果箱、香蕉箱分开并行处理时可以同时扫描多个列的箱子比如同时统计苹果和香蕉的销量效率翻倍。核心概念原理和架构的文本示意图ClickHouse核心架构 数据按列存储 → 列数据块压缩 → 稀疏索引定位数据块 → 向量化执行引擎处理数据块 → 多CPU/服务器并行计算 → 结果汇总输出Mermaid 流程图原始数据按列拆分存储列数据块压缩稀疏索引记录块位置查询请求根据索引定位目标数据块向量化引擎加载数据块多CPU核心并行处理结果汇总输出核心算法原理 具体操作步骤列式存储的底层实现ClickHouse的列式存储不是简单的按列存放而是采用了更精细的数据块Block结构。每个数据块包含列名、数据类型等元信息实际数据如1000条订单金额的数值压缩信息记录数据块的压缩算法和压缩比例如对于订单表user_id, amount, create_time存储结构如下列1user_id: [Block1: 1-1000条user_id, Block2: 1001-2000条user_id, ...] 列2amount: [Block1: 1-1000条amount, Block2: 1001-2000条amount, ...] 列3create_time: [Block1: 1-1000条create_time, Block2: 1001-2000条create_time, ...]向量化执行的关键——数据块处理ClickHouse的执行引擎以65536条为一个数据块可配置处理逻辑如下以计算订单金额平均值为例从amount列加载一个数据块65536条金额值使用CPU的SIMD指令如AVX2一次性计算该块的总和与数量将每个数据块的总和与数量累加最后计算总平均值并行处理的任务拆分当查询涉及多分区或分布式集群时ClickHouse会将查询拆分为多个子任务如按时间分区拆分为1月数据查询、“2月数据查询”为每个子任务分配独立的CPU核心或集群节点子任务并行执行后通过归并操作得到最终结果Python伪代码演示查询过程# 假设我们有一个订单表需要计算金额平均值defcalculate_avg_amount():total_sum0total_count0# 1. 遍历所有数据块列式存储的块forblockinamount_column.blocks:# 2. 向量化加载数据块一次加载65536条chunkblock.load_vectorized()# 3. 并行计算块内总和与数量模拟SIMD操作chunk_sumsum(chunk)# 实际是CPU向量化指令加速chunk_countlen(chunk)# 4. 累加结果total_sumchunk_sum total_countchunk_count# 5. 计算最终平均值returntotal_sum/total_count数学模型和公式 详细讲解 举例说明数据压缩率的数学模型ClickHouse通过列级压缩如LZ4、ZSTD减少存储空间压缩率计算公式为压缩率 原始数据大小 压缩后数据大小 压缩率 \frac{原始数据大小}{压缩后数据大小}压缩率压缩后数据大小原始数据大小​举例假设某列存储10000条相同的2024-05-20日期值每条8字节原始大小80000字节采用RLE游程编码压缩后只需存储值:2024-05-20重复次数:10000约20字节压缩率为80000/204000:1。查询时间复杂度优化传统行式数据库查询某列的时间复杂度为O ( N ) O(N)O(N)需扫描所有行ClickHouse列式存储的时间复杂度为O ( M ) O(M)O(M)M为目标列的数据量通常MN。举例查询1000万条记录的订单金额列行式存储需读取1000万×3列假设每行3列3000万条数据列式存储只需读取1000万条金额数据数据量减少2/3查询时间大幅缩短。并行处理的加速比公式根据阿姆达尔定律并行处理的加速比为S 1 ( 1 − P ) P N S \frac{1}{(1 - P) \frac{P}{N}}S(1−P)NP​1​其中P可并行化的任务比例如90%的查询可拆分N并行核心数如8核举例当P0.9N8时加速比S 1 / ( 0.1 0.9 / 8 ) 5.71 S1/(0.1 0.9/8)5.71S1/(0.10.9/8)5.71即查询时间从100ms缩短到约17.5ms。项目实战电商订单数据分析开发环境搭建以Docker为例安装Docker略启动ClickHouse容器dockerrun-d--nameclickhouse-server\-p8123:8123-p9000:9000\-v/data/clickhouse:/var/lib/clickhouse\yandex/clickhouse-server连接客户端使用官方CLI工具或DBeaverdockerexec-itclickhouse-server clickhouse-client源代码详细实现和代码解读步骤1创建订单表使用MergeTree引擎CREATETABLEecommerce_orders(order_id UInt64,-- 订单IDuser_id UInt32,-- 用户IDamountDecimal(10,2),-- 订单金额create_timeDateTime,-- 下单时间region String-- 地区)ENGINEMergeTree()ORDERBY(create_time,user_id)-- 按时间和用户ID排序优化查询PARTITIONBYtoYYYYMM(create_time)-- 按月分区SETTINGS index_granularity8192;-- 索引粒度每8192条记录建一个索引代码解读MergeTree是ClickHouse的核心引擎支持数据分区、排序、索引适合时间序列数据。PARTITION BY按月分区将数据按月份分成多个文件查询某月份数据时只需扫描对应分区。ORDER BY按时间排序使时间范围查询如最近30天能快速定位数据块。步骤2插入模拟数据1000万条使用Python脚本生成测试数据需安装clickhouse-driverfromclickhouse_driverimportClientimportrandomfromdatetimeimportdatetime,timedelta clientClient(hostlocalhost)# 生成1000万条订单数据defgenerate_orders():orders[]start_timedatetime(2024,1,1)foriinrange(10**7):order_idi1user_idrandom.randint(1,100000)amountround(random.uniform(10,1000),2)create_timestart_timetimedelta(secondsi)regionrandom.choice([华北,华东,华南,华中])orders.append((order_id,user_id,amount,create_time,region))# 每10万条批量插入一次iflen(orders)%1000000:client.execute(INSERT INTO ecommerce_orders VALUES,orders)orders[]# 插入剩余数据iforders:client.execute(INSERT INTO ecommerce_orders VALUES,orders)generate_orders()代码解读使用clickhouse-driver连接数据库支持批量插入提升写入速度。按10万条批量插入ClickHouse推荐的批量大小减少网络IO开销。数据包含时间、地区等维度模拟真实电商场景。步骤3执行复杂查询统计各地区月均订单金额SELECTregion,-- 地区toYYYYMM(create_time)ASmonth,-- 月份AVG(amount)ASavg_amount,-- 平均金额SUM(amount)AStotal_amount-- 总金额FROMecommerce_ordersWHEREcreate_timeBETWEEN2024-01-01AND2024-12-31-- 时间过滤GROUPBYregion,monthORDERBYmonth,region;执行结果示例regionmonthavg_amounttotal_amount华北202401289.5612,345,678.90华东202401312.4515,678,901.23…………查询优化分析分区过滤WHERE条件按时间过滤ClickHouse自动跳过非2024年的分区如2023年数据。向量化聚合AVG和SUM函数通过向量化引擎批量计算数据块而非逐条处理。并行执行查询会拆分为多个子任务按分区或数据块由多个CPU核心并行计算。代码解读与分析通过上述实战可以看到ClickHouse的优势体现在写入高效批量插入1000万条数据仅需几分钟取决于服务器配置。查询快速对1000万条数据的多维度聚合查询响应时间通常在200ms以内测试环境4核CPU16GB内存。存储节省1000万条订单数据每行约40字节行式存储需约400MBClickHouse列式存储压缩后仅需约80MB压缩率5:1。实际应用场景场景1电商用户行为分析某电商平台每天产生5亿条用户行为日志点击、加购、下单需要实时统计各商品类目今日GMV。使用ClickHouse后存储5亿条日志压缩后仅需50GB原行式存储需250GB。查询今日各类目GMV查询从Hive的10分钟缩短到80ms。场景2物联网设备监控某智能工厂有10万台设备每5秒上报一次传感器数据温度、湿度、转速。使用ClickHouse存储每天产生10万×12×36004.32亿条数据列式存储轻松管理。查询近1小时各设备温度异常次数查询可在200ms内完成支持实时监控告警。场景3广告效果统计某广告平台需要实时统计各广告位、各地区、各时段的点击率。ClickHouse支持高并发写入每秒处理10万广告点击事件。复杂查询多维度广告位地区时段的聚合查询毫秒级响应。工具和资源推荐官方工具ClickHouse Client命令行客户端用于执行SQL和管理数据库。ClickHouse Web界面通过8123端口访问的Web UI如http://localhost:8123/play支持SQL在线执行。CHBenchmark官方性能测试工具用于模拟真实查询场景。第三方工具DBeaver图形化数据库管理工具支持ClickHouse连接和可视化查询。Grafana与ClickHouse集成实现数据可视化监控如查询耗时、QPS。Vector轻量级数据收集工具支持将日志/指标写入ClickHouse。学习资源官方文档ClickHouse Documentation强烈推荐包含详细语法和最佳实践社区博客GitHub上的clickhouse/clickhouse仓库源码issue讨论书籍《ClickHouse原理解析与应用实践》机械工业出版社适合深入学习未来发展趋势与挑战趋势1云原生深度融合随着云数据库如AWS Managed ClickHouse、阿里云AnalyticDB的普及ClickHouse将进一步集成云原生特性自动扩缩容根据负载自动增加/减少节点。Serverless架构按实际使用量付费降低中小企业成本。云存储集成直接读取S3/OSS中的数据无需导入到本地。趋势2实时数据处理增强企业对实时分析的需求从准实时分钟级向实时秒级/毫秒级演进ClickHouse正在优化实时写入提升高并发写入场景下的稳定性如每秒百万级写入。流式集成与Kafka、Pulsar等消息队列深度集成支持流式数据直接分析。内存计算结合本地内存和分布式缓存进一步缩短查询延迟。挑战1复杂事务支持ClickHouse定位于OLAP场景对事务ACID支持较弱。未来需在以下方面改进支持跨行更新当前主要用于插入和查询更新操作性能较差。多表Join优化复杂Join查询的性能仍有提升空间尤其是大表Join。挑战2生态兼容性与Hadoop/Spark生态的集成仍需完善数据迁移从Hive/Parquet到ClickHouse的迁移工具需更易用。计算框架集成支持Spark SQL直接查询ClickHouse减少数据拷贝。总结学到了什么核心概念回顾列式存储数据按列存储大幅减少查询时的IO开销像超市分类摆放商品。向量化执行批量处理数据块利用CPU向量化指令加速计算像货车批量送快递。并行处理拆分查询任务到多核心/多节点提升大数据量下的查询速度像流水线包饺子。概念关系回顾三个核心概念环环相扣列式存储为向量化执行提供数据基础向量化执行让并行处理更高效三者共同实现了海量数据、快速查询的目标。思考题动动小脑筋假设你负责一个社交平台的日志分析系统每天产生1亿条用户登录日志包含用户ID、登录时间、设备类型。如果用ClickHouse存储你会如何设计表结构分区、排序、索引为什么ClickHouse的列式存储在哪些场景下可能不如行式存储提示思考需要频繁读取整行数据的场景如果你需要查询2024年每个用户的首次登录时间ClickHouse的哪些特性如排序键、索引能帮助优化这个查询附录常见问题与解答Q1ClickHouse适合存储实时数据吗A非常适合ClickHouse支持高并发写入每秒可写入10万-100万条记录且写入后立即可以查询无Hive的小文件问题。Q2ClickHouse和MySQL的区别是什么AMySQL是行式存储的OLTP数据库适合高频增删改ClickHouse是列式存储的OLAP数据库适合复杂统计查询。两者是互补关系而非替代关系。Q3ClickHouse如何保证数据可靠性A支持副本机制ReplicatedMergeTree引擎数据会自动同步到多个节点单个节点故障不影响数据可用性。Q4ClickHouse的学习成本高吗A基础SQL语法与MySQL类似学习成本较低。难点在于理解分区、排序键、引擎选择等高级特性需要结合实际场景调优。扩展阅读 参考资料ClickHouse官方文档https://clickhouse.com/docs/en/《ClickHouse权威指南》作者张凯峰论文《ClickHouse: A Fast Open Source OLAP Database Management System》GitHub仓库https://github.com/ClickHouse/ClickHouse

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2438647.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…