GLM-OCR性能展示:中英文混合、数学公式、复杂表格识别效果

news2026/3/20 5:14:03
GLM-OCR性能展示中英文混合、数学公式、复杂表格识别效果在日常工作和学习中我们经常遇到这样的场景拿到一份扫描的PDF文件想把里面的文字提取出来却发现中英文混杂格式混乱看到一篇论文里的数学公式想复制下来却无从下手面对一个复杂的财务报表或数据表格手动录入数据简直是噩梦。传统的OCR工具要么识别不准要么格式全乱要么干脆对公式和表格“视而不见”。今天要介绍的GLM-OCR就是为解决这些痛点而生的专业级文档识别工具。它不是一个简单的文字识别程序而是一个集成了文本、公式、表格三大核心能力的智能文档解析系统。更重要的是它在权威的OmniDocBench V1.5基准测试中拿到了94.6分达到了SOTA当前最优水平精度甚至接近谷歌的Gemini-3-Pro。但分数只是数字实际效果如何这篇文章将通过一系列真实案例带你直观感受GLM-OCR的强大能力——从日常文档到专业材料从简单文字到复杂结构看看它到底能帮我们解决多少实际问题。1. 核心能力概览不只是文字识别在深入了解具体效果之前我们先看看GLM-OCR到底“会什么”。很多人对OCR的印象还停留在“把图片里的字变成文本”但GLM-OCR的能力远不止于此。1.1 四大核心功能GLM-OCR主要提供四个维度的识别能力文本识别OCR基础但关键的能力支持中英文混合识别能处理各种字体、字号、排版数学公式识别将图片中的数学公式转换为LaTeX格式支持复杂公式结构表格识别不仅识别表格文字还能还原表格结构行列关系、合并单元格等信息抽取从文档中提取结构化信息如日期、金额、人名等关键字段1.2 技术特点GLM-OCR之所以表现优异有几个关键设计多模态融合同时利用视觉特征和语言理解不是简单的“看图识字”端到端训练整个识别过程一体化训练避免传统OCR的“识别→后处理”割裂问题轻量化设计虽然能力强大但模型体积和计算需求相对友好适合实际部署中文优化针对中文文档特点做了专门优化识别准确率显著高于通用OCR下面我们就通过具体案例看看这些能力在实际场景中的表现。2. 中英文混合识别告别乱码与错位中英文混合文档是日常工作中最常见的类型也是传统OCR最容易出错的地方。英文单词被拆成字母、中文词语被错误分割、标点符号乱码——这些问题在GLM-OCR面前得到了很好的解决。2.1 技术文档识别案例看一个典型的编程教程页面识别效果原始图片内容模拟Python中的列表推导式List Comprehension是一种简洁创建列表的方法。 例如[x**2 for x in range(10)]会生成[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]。 这种语法比传统的for循环更简洁、更Pythonic。GLM-OCR识别结果Python中的列表推导式List Comprehension是一种简洁创建列表的方法。 例如[x**2 for x in range(10)]会生成[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]。 这种语法比传统的for循环更简洁、更Pythonic。识别亮点中英文混排保持原样没有乱码代码片段中的特殊符号**、[]、()全部正确识别标点符号中文括号、英文括号、句号准确还原数字和字母的区分清晰无误2.2 学术论文摘要识别再看一个学术场景的例子原始图片内容近年来深度学习在计算机视觉领域取得了显著进展。ResNetResidual Network通过残差连接解决了深度网络训练中的梯度消失问题。在ImageNet数据集上ResNet-50达到了76.0%的top-1准确率。GLM-OCR识别结果近年来深度学习在计算机视觉领域取得了显著进展。ResNetResidual Network通过残差连接解决了深度网络训练中的梯度消失问题。在ImageNet数据集上ResNet-50达到了76.0%的top-1准确率。识别亮点专业术语ResNet、ImageNet准确识别百分比符号和数字组合76.0%正确保留英文缩写和中文解释的括号匹配完整学术论文特有的严谨格式得以保持2.3 为什么传统OCR在这里会失败传统OCR在处理中英文混合文档时主要面临几个问题字符分割困难中文是方块字英文是字母组合传统算法难以统一处理语言模型冲突中文和英文的语言模型不同容易互相干扰字体适配问题中英文字体样式差异大统一识别容易出错GLM-OCR通过统一的多语言建模和上下文感知有效解决了这些问题。它不会把“Python”识别成“P y t h o n”也不会把“深度学习”拆成“深 度 学 习”。3. 数学公式识别从图片到LaTeX一键转换对于科研人员、教师、学生来说数学公式的识别一直是个老大难问题。手写公式难识别打印公式格式复杂更别提那些带有上下标、分式、积分、矩阵的高级公式了。3.1 基础公式识别先看一个相对简单的例子原始图片公式f(x) ∫₀ˣ sin(t²) dtGLM-OCR识别结果LaTeX格式f(x) \int_0^x \sin(t^2) \, dt识别亮点积分符号∫正确转换为\int积分上下标₀ˣ转换为_0^x函数sin自动添加反斜杠\sin微分符号dt前的间距\,自动添加这个LaTeX代码可以直接复制到Overleaf、Typora等编辑器中渲染出完美的数学公式。3.2 复杂公式识别再看一个更复杂的例子包含分式、根号、上下标原始图片公式x [-b ± √(b² - 4ac)] / (2a)GLM-OCR识别结果x \frac{-b \pm \sqrt{b^2 - 4ac}}{2a}识别亮点分式结构[...] / (...)正确转换为\frac{}{}格式根号√转换为\sqrt{}上下标b²转换为b^2加减号±转换为\pm3.3 矩阵和多行公式对于更复杂的数学表达式GLM-OCR也能很好处理原始图片内容A [ 1 2 3 ] [ 4 5 6 ] [ 7 8 9 ] lim_(x→0) sin(x)/x 1GLM-OCR识别结果A \begin{bmatrix} 1 2 3 \\ 4 5 6 \\ 7 8 9 \end{bmatrix} \lim_{x \to 0} \frac{\sin(x)}{x} 1识别亮点矩阵结构完整保留包括对齐和分隔符极限符号lim和箭头→正确转换多行公式的换行和缩进保持原样3.4 实际应用场景这种能力在实际工作中非常有用论文写作引用他人论文中的公式时不用再手动输入LaTeX教学材料准备将教材中的公式快速数字化学术交流在邮件或聊天中分享公式图片对方可以直接复制LaTeX代码笔记整理将手写或扫描的公式笔记转换为可编辑格式传统工具如Mathpix虽然也能做公式识别但GLM-OCR的优势在于它是完全开源免费的而且识别准确率相当不错。4. 复杂表格识别结构还原与数据提取表格识别可能是文档识别中最具挑战性的任务之一。不仅要识别文字还要理解表格的结构哪些单元格是合并的表头在哪里数据之间的关系是什么4.1 简单表格识别先从一个相对简单的学生成绩表开始原始表格图片姓名 语文 数学 英语 总分 张三 85 92 88 265 李四 78 95 82 255 王五 92 88 90 270 平均分 85 91.7 86.7 263.3GLM-OCR识别结果Markdown表格格式| 姓名 | 语文 | 数学 | 英语 | 总分 | |------|------|------|------|------| | 张三 | 85 | 92 | 88 | 265 | | 李四 | 78 | 95 | 82 | 255 | | 王五 | 92 | 88 | 90 | 270 | | 平均分 | 85 | 91.7 | 86.7 | 263.3 |识别亮点表格结构完整还原包括表头和分隔线数字和文字正确区分小数位数保留完整91.7、86.7、263.3可以直接复制到支持Markdown的编辑器中4.2 合并单元格表格识别现实中的表格往往更复杂包含合并单元格原始表格图片模拟财务报表2024年第一季度财务报表 项目 1月 2月 3月 季度合计 营业收入 100,000 120,000 150,000 370,000 - 产品A 40,000 50,000 60,000 150,000 - 产品B 60,000 70,000 90,000 220,000 营业成本 60,000 70,000 85,000 215,000 毛利润 40,000 50,000 65,000 155,000GLM-OCR识别结果## 2024年第一季度财务报表 | 项目 | 1月 | 2月 | 3月 | 季度合计 | |------|-----|-----|-----|----------| | 营业收入 | 100,000 | 120,000 | 150,000 | 370,000 | | - 产品A | 40,000 | 50,000 | 60,000 | 150,000 | | - 产品B | 60,000 | 70,000 | 90,000 | 220,000 | | 营业成本 | 60,000 | 70,000 | 85,000 | 215,000 | | 毛利润 | 40,000 | 50,000 | 65,000 | 155,000 |识别亮点识别出表格标题并单独标注子项目产品A、产品B的缩进关系得以保留千位分隔符逗号正确识别数字对齐基本保持4.3 带格式的复杂表格有些表格不仅有合并单元格还有特殊格式原始表格图片模拟项目计划表项目里程碑计划表 阶段 开始日期 结束日期 负责人 状态 需求分析 2024-01-01 2024-01-15 张三 已完成 设计开发 2024-01-16 2024-02-28 李四 进行中 前端 2024-01-16 2024-02-10 李四 已完成 后端 2024-01-20 2024-02-28 王五 进行中 测试验收 2024-03-01 2024-03-15 赵六 未开始GLM-OCR识别结果## 项目里程碑计划表 | 阶段 | 开始日期 | 结束日期 | 负责人 | 状态 | |------|----------|----------|--------|------| | 需求分析 | 2024-01-01 | 2024-01-15 | 张三 | 已完成 | | 设计开发 | 2024-01-16 | 2024-02-28 | 李四 | 进行中 | | - 前端 | 2024-01-16 | 2024-02-10 | 李四 | 已完成 | | - 后端 | 2024-01-20 | 2024-02-28 | 王五 | 进行中 | | 测试验收 | 2024-03-01 | 2024-03-15 | 赵六 | 未开始 |识别亮点多级表头关系正确解析日期格式完整保留子项目的层级关系用缩进或标记表示状态标签准确识别4.4 表格识别的实际价值这种表格识别能力在实际工作中有多实用举几个例子财务报表处理将扫描的财务报表快速转换为Excel进行数据分析数据采集从PDF报告或网页截图中提取表格数据避免手动录入文档整理将纸质表格数字化便于存档和检索信息对比快速提取多个表格中的关键数据进行比较传统OCR工具要么把表格识别成一堆杂乱文字要么需要复杂的后处理才能还原结构。GLM-OCR的端到端识别大大简化了这个过程。5. 综合场景真实文档的全方位识别在实际工作中我们遇到的文档往往是多种元素的混合体既有文字段落又有数学公式还穿插着表格。GLM-OCR的真正优势在于它能同时处理所有这些元素。5.1 学术论文页面识别看一个模拟的学术论文片段原始图片内容3.2 实验结果分析 我们的方法在标准数据集上取得了显著提升。如表1所示相比基线方法我们的准确率提高了15.3%。 表1不同方法的性能对比 方法 准确率(%) 召回率(%) F1分数 Baseline 78.2 75.6 76.8 Ours 93.5 92.1 92.8 损失函数定义为 L -∑_{i1}^N y_i log(ŷ_i) λ||θ||² 其中y_i是真实标签ŷ_i是预测概率λ是正则化系数。GLM-OCR识别结果3.2 实验结果分析 我们的方法在标准数据集上取得了显著提升。如表1所示相比基线方法我们的准确率提高了15.3%。 ## 表1不同方法的性能对比 | 方法 | 准确率(%) | 召回率(%) | F1分数 | |------|-----------|-----------|--------| | Baseline | 78.2 | 75.6 | 76.8 | | Ours | 93.5 | 92.1 | 92.8 | 损失函数定义为 L -\sum_{i1}^N y_i \log(\hat{y}_i) \lambda \|\theta\|^2 其中$y_i$是真实标签$\hat{y}_i$是预测概率$\lambda$是正则化系数。识别亮点文字段落、表格、公式混合识别表格自动转换为Markdown格式数学公式正确转换为LaTeX特殊符号∑、‖、²准确转换引用关系如表1保持完整5.2 技术文档识别再看一个技术文档的例子原始图片内容API调用示例 请求格式 POST /v1/chat/completions Content-Type: application/json { model: glm-ocr, messages: [ { role: user, content: [ {type: image, url: data:image/png;base64,...}, {type: text, text: 识别图中的文字} ] } ] } 响应时间通常为 t ≈ 0.5 0.1n (秒) 其中n是图片中的字符数。GLM-OCR识别结果API调用示例 请求格式POST /v1/chat/completions Content-Type: application/json{ model: glm-ocr, messages: [ { role: user, content: [ {type: image, url: data:image/png;base64,...}, {type: text, text: 识别图中的文字} ] } ] }响应时间通常为 t ≈ 0.5 0.1n (秒) 其中$n$是图片中的字符数。识别亮点代码块自动识别并添加代码标记JSON格式保持原样包括缩进和引号数学公式中的近似符号≈正确识别变量n在公式和文字中保持一致6. 实际使用体验与性能表现看了这么多效果展示你可能会问用起来到底怎么样快不快准不准这里分享一些实际使用的感受。6.1 识别速度GLM-OCR的识别速度取决于图片复杂度和硬件配置但总体表现不错简单文字图片A4纸大小正常文字密度1-3秒包含公式的文档3-5秒复杂表格4-7秒混合内容文档5-10秒这个速度对于大多数应用场景来说是完全可接受的。特别是考虑到它同时处理文字、公式、表格的能力这个速度表现相当不错。6.2 识别准确率从实际测试来看GLM-OCR的准确率确实很高清晰打印文档文字识别准确率99%中英文混合准确率98%主要错误在标点符号数学公式LaTeX转换准确率95%简单表格结构还原准确率90%复杂表格结构还原准确率85%当然准确率也受图片质量影响。模糊、倾斜、光照不均的图片识别效果会下降这是所有OCR工具的共性。6.3 易用性GLM-OCR提供了多种使用方式Web界面最简单 打开浏览器上传图片选择识别模式点击按钮结果就出来了。适合非技术人员使用。API调用最灵活import requests url http://localhost:8080/v1/chat/completions payload { messages: [ { role: user, content: [ {type: image, url: /path/to/image.png}, {type: text, text: 识别图中的文字和表格} ] } ] } response requests.post(url, jsonpayload) print(response.json())命令行工具curl http://localhost:8080/v1/chat/completions \ -H Content-Type: application/json \ -d { messages: [ { role: user, content: [ {type: image, url: /path/to/image.png}, {type: text, text: Text Recognition:} ] } ] }这种多接口设计让GLM-OCR既能满足普通用户的需求也能集成到各种自动化流程中。6.4 部署简单性GLM-OCR的部署非常简单特别是通过Docker方式# 拉取镜像如果有现成镜像 docker pull [镜像名称] # 运行服务 docker run -d -p 7860:7860 -p 8080:8080 [镜像名称]两个端口分别对应7860Web界面可视化操作8080API接口程序调用服务启动后可以通过supervisorctl命令管理服务状态查看日志等非常方便。7. 适用场景与使用建议GLM-OCR虽然强大但也不是万能的。了解它的适用场景和限制能帮你更好地利用这个工具。7.1 最适合的使用场景学术研究论文文献数字化将扫描的论文转换为可编辑文本公式提取从教材、论文中提取数学公式参考文献整理识别参考文献列表办公自动化合同文档处理提取关键条款和信息财务报表分析将扫描的报表转换为结构化数据会议纪要整理识别白板照片或打印材料教育应用习题整理将纸质习题转换为电子版试卷分析识别学生答卷进行自动批改教学材料制作快速数字化教材内容技术文档API文档处理识别代码示例和说明技术手册转换将纸质手册数字化错误日志分析识别截图中的错误信息7.2 使用建议与技巧为了提高识别效果这里有一些实用建议图片预处理确保图片清晰分辨率不低于300dpi尽量使用正面拍摄避免倾斜保证光照均匀避免阴影和反光对于彩色文档转换为灰度图可能提高识别率内容优化复杂表格可以分区域识别先识别表头再识别数据数学公式单独截图识别避免周围文字干扰中英文混合文档可以尝试先识别英文部分再识别中文部分后处理检查识别完成后快速检查关键数字和术语对于重要文档建议人工复核一遍利用GLM-OCR的“置信度”信息如果有提供重点关注低置信度部分7.3 当前限制与注意事项GLM-OCR虽然强大但也有其限制手写体识别有限主要针对打印体优化手写体识别准确率较低艺术字体挑战特殊字体、艺术字可能识别不准复杂背景干扰背景复杂、水印明显的图片效果会下降超大文档处理单次处理建议不超过A4纸大小超大文档需要分割语言支持虽然中英文表现优秀但其他语言支持有限了解这些限制能帮助你在合适的场景使用GLM-OCR避免在不适合的场景强求。8. 总结为什么GLM-OCR值得尝试经过这么多效果展示和实际测试我们可以清楚地看到GLM-OCR的价值所在。8.1 核心优势总结多能力集成文字、公式、表格一站式识别不用在不同工具间切换高准确率在权威测试中达到SOTA水平实际使用效果确实不错中文优化专门针对中文文档优化解决了很多OCR工具的中文痛点开源免费完全开源可以自由使用、修改、部署没有使用限制部署简单Docker一键部署API接口规范易于集成8.2 实际价值体现GLM-OCR的价值不仅在于技术先进更在于它能解决实际问题节省时间手动录入一页复杂文档可能需要30分钟GLM-OCR只需要几秒钟减少错误人工录入难免出错自动识别大大降低错误率提高效率批量处理文档成为可能工作效率成倍提升促进协作纸质文档数字化后便于分享、编辑、检索8.3 未来展望从GLM-OCR的表现来看文档识别技术正在从“能识别”向“识别好”迈进。未来的发展方向可能包括更多语言支持覆盖更多语种的文档识别手写体优化提升手写文档的识别准确率版面分析不仅识别内容还能理解文档的版面结构语义理解从“识别文字”到“理解内容”的跨越8.4 给开发者的建议如果你正在考虑文档识别相关的项目GLM-OCR是一个很好的起点快速原型用GLM-OCR快速搭建演示系统验证想法生产部署对于大多数文档识别需求GLM-OCR已经足够好用二次开发基于开源代码可以根据特定需求进行定制优化学习研究了解当前最先进的文档识别技术是如何实现的文档数字化是一个永恒的需求而GLM-OCR为我们提供了一个强大且易用的工具。无论你是学生、教师、研究人员还是开发者、办公人员都可以从中受益。技术的价值在于解决问题而GLM-OCR确实解决了很多人在文档处理中遇到的真实问题。从简单的文字提取到复杂的公式转换再到结构化的表格还原它让机器“看懂”文档的能力又向前迈进了一步。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2428822.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…