MIT AI工具一分钟预览高度逼真3D打印成品外观,所见即所得

news2026/4/9 4:57:31
从电影道具到医疗设备3D打印正在快速改变我们制造功能原型的方式。然而大多数打印软件生成的预览只关注结构路径忽略了颜色、光泽、纹理等外观要素导致用户常常需要反复试印。根据3D科学谷的市场观察MIT和普林斯顿大学等机构的研究团队推出了一款名为VisiPrint的人工智能预览工具只需上传一张切片截图和一张材料照片就能在一分钟内生成高度逼真的成品渲染图。用户研究表明VisiPrint的任务完成率达到100%远超传统切片软件63%和通用建模软件13%有望大幅减少3D打印中的浪费与试错成本。设计师、创客经常使用3D打印技术快速制作功能原型从电影道具到医疗设备无所不包。准确的打印预览至关重要这样用户才能确信最终造出的物体会如预期般工作。然而大多数3D打印软件生成的预览侧重于功能而非外观。打印出来的物体可能在颜色、质感或明暗效果上与用户的预期大相径庭导致反复重印浪费大量时间、精力和材料。一项研究估计多达三分之一的打印材料最终直接变成了垃圾其中很大一部分来自被丢弃的原型。为了帮助用户提前预判成品的视觉效果来自麻省理工学院MIT计算机科学与人工智能实验室CSAIL以及普林斯顿大学的研究人员开发了一款易用的预览工具将外观放在首位。该工具被命名为VisiPrint相关论文已被ACM人机交互计算系统会议CHI接收。图VisiPrint工作流程。用户使用自己偏好的软件例如Cura对3D模型进行切片然后上传切片视图的截图以及目标打印线材或打印样本的照片。VisiPrint会生成一个忠实于外观的预览图同时反映切片路径和材料特性。工作流程两张图一分钟用户只需上传一张来自3D打印软件即“切片软件”的物体截图以及一张打印材料的照片可以是在线图片或自己拍摄的样本。系统便会根据这些输入自动生成物体打印后可能呈现的效果渲染图。研究团队聚焦于熔融沉积成型FDM——最常见的3D打印类型。在FDM中打印材料线材被熔化后通过喷嘴挤出逐层堆叠成型。生成准确的美学预览颇具挑战因为熔化和挤出过程会改变材料的外观每层沉积的高度以及喷嘴移动的路径也会产生影响。VisiPrint使用两个协同工作的人工智能模型来克服这些难题。其中一个是计算机视觉模型负责从材料样本中提取对物体外观至关重要的特征颜色、光泽、半透明性等。另外一个是生成式AI模型基于Stable Diffusion XL。负责根据这些特征同时融入喷嘴的“切片”路径信息计算出物体的几何形状和结构最终合成预览图。图使用自备材料样本蓝色和透明球体以及在线找到的样本包括具有挑战性的半透明和彩虹色线材预览的小船。创新条件控制方法3D科学谷了解到这项研究方法的关键在于一种特殊的条件控制方法conditioning method。研究人员通过仔细调整模型内部的工作机制引导它遵循切片路径并遵守3D打印过程的各项约束。图VisiPrint系统架构。系统以材料样本和3D几何模型为输入。材料通过图像提示适配器IP Adapter进行编码而几何模型则经过切片和渲染。切片信息、几何结构以及潜在的照明线索通过多路ControlNet流程引导图像生成。生成的输出通过扩散修复模型SDXL进行精炼并经过颜色校正最终完成从而生成3D打印物体的照片级真实感预览。具体来说他们的条件控制方法利用了两类信息一类是保留物体的形状和明暗变化的深度图一类是反映内部轮廓和结构边界尤其是层纹lamination细节的边缘图Canny边缘检测。“如果这两者的平衡掌握不好就可能产生错误的几何形状或不正确的切片路径。我们必须非常小心地将它们以恰当的方式结合起来”论文第一作者、MIT电气工程与计算机科学系EECS研究生Maxine Perroni-Scharf表示。在用户界面中研究人员提供了一个直观的“切片影响强度”滑块让用户可以自由调节层纹细节与整体光影之间的权重。专为FDM优化兼容任意切片软件VisiPrint的设计与打印机或切片软件类型无关。它既可以作为独立工具使用用户上传任意切片软件的截图也以Ultimaker Cura插件的形式集成到主流工作流中。一旦模型切片完成插件会自动捕获3D视口截图用户可直接在Cura内部生成预览。研究团队还建立了一个包含12种物体8个Thingiverse模型 4个基本几何体的数据集分别用四种典型线材实心粉、实心蓝、透明白、金属银打印涵盖半透明、高光、哑光等多种质感。所有真值照片均在受控光照环境下拍摄以保证对比的公平性。用户研究100%完成率为了验证VisiPrint的实际效果研究团队招募了15名具有一定3D打印经验的用户进行了一项对照实验。每个参与者需要完成两项任务用银色PLA打印一艘Benchy小船以及用透明PLA打印一个哨子。参与者分别使用三种工具完成相同的预览任务VisiPrint、Cura主流开源切片软件和Blender通用3D建模软件使用PBR材质渲染。每项任务限时5分钟。结果如下工具任务完成率平均完成时间VisiPrint100%(30/30)66.4秒Cura63% (19/30)158.5秒Blender13% (4/30)250.2秒VisiPrint不仅完成率最高速度也比Cura快2.4倍比Blender快近4倍。在NASA任务负荷指数TLX评估中VisiPrint在脑力需求、时间紧迫感、任务成功感、努力程度、不安全感等所有维度上均显著优于Cura和Blenderp0.05。用户对其生成的“照片级真实感”评分平均为6.20/7对预览与实际打印匹配的信心也显著更高。感知研究与真实照片几乎无异在另一项感知研究中参与者手持真实的打印物体银色小船和透明哨子并排比较六种预览图像Blender均匀纹理、Blender PBR材质、Cura默认颜色、VisiPrint、真实物体照片、以及Cura的“银色/透明”专用预览。图感知研究小船。上图针对整体相似度、纹理相似度、切片相似度三个指标非中性Likert评分的分布情况。下图参与者的平均排名。VisiPrint与真实照片在统计学上无显著差异且排名最高Cura银色预览处于中游Blender和Cura黄色预览排名最低。结果表明在整体外观相似度方面VisiPrint和真实照片处于同一梯队显著高于Cura和Blender的各类预览在纹理相似度方面VisiPrint与真实照片无统计学差异Cura和Blender相对落后在切片层纹相似度方面VisiPrint与真实照片依然并列最高Cura在某些情况下因专注于切片可视化而表现接近但整体外观和纹理远不如VisiPrint。值得注意的是有少数参与者将VisiPrint的预览排名排在了真实照片之前。研究人员认为这可能是由于照片拍摄时的光照条件与实物在手中的观感存在差异反而说明VisiPrint能够呈现一种“理想化”的真实感。用户反馈与未来展望在问卷调查中15人中有12人表示更愿意使用VisiPrint而非仅用Cura或Blender进行打印预览。14人表示未来会再次使用VisiPrint。同时用户也提出了一些改进建议例如他们希望支持3D模型的旋转和多角度预览以及更紧密的集成如直接上传3D模型而非截图。部分用户还提到了解算法的基本原理有助于建立对预览结果的信任。针对这一点研究团队在界面中加入了明确的“预览局限性”提示面板告知用户VisiPrint仅用于外观评估光泽、色调倾向、层纹方向等不预测可打印性、机械强度或安全关键部件的成功率。所有输出图像均带有“模拟预览”水印以校准用户预期。技术评估超越现有方法研究人员还将VisiPrint与多种基线方法进行了定量比较包括ZeST零样本材质转移、IP-Adapter、MatSwap以及单图像SVBRDF估计。评价指标包括PSNR峰值信噪比、LPIPS感知相似度和CLIP相似度计算对象均为真实打印物体的照片。图各方法预览效果定性对比左图来自Thingiverse的3D打印物体的真实照片以及对应的切片几何模型和材料样本。右图VisiPrint与各基线方法的预览效果对比。VisiPrint在材料保真度、切片细节和几何形状三方面达到了最佳结合。VisiPrint在所有指标上均取得了最佳成绩尤其是在像素级保真度和语义对齐方面显著优于其他方法。消融研究进一步证实了各组件的贡献颜色校正color harmonization带来的提升最大单独使用深度图会导致中空区域出现伪影而加入Canny边缘控制后层纹细节得以保留整体CLIP相似度从0.894提升至0.912。局限性与未来工作研究团队在论文中指出尽管VisiPrint在预览真实感上取得了显著进步仍存在一些局限主要包括以下几点依赖单目深度估计和Canny边缘在细节复杂或中空区域可能引入伪影预览质量受材料样本照片的光照影响较大且不支持任意重光照继承MatCap类方法的固有限制目前主要针对FDM打印和标准PLA线材优化对金属色、半透明、多色等复杂材质的效果尚未充分验证不模拟支撑结构痕迹或打印失败的可能性。未来研究团队希望解决极精细细节预览时的伪影问题增加多角度预览功能并探索将VisiPrint扩展到SLA光固化等其他3D打印技术。3D打印领域的所见即所得“所见即所得WYSIWYG是桌面出版在20世纪80年代得以普及的关键因为它让用户第一次尝试就能得到想要的结果。现在是时候让3D打印也实现‘所见即所得’了。VisiPrint朝着这个方向迈出了重要一步”并未参与此项研究的哈索·普拉特纳研究所计算机科学教授Patrick Baudisch评价道。论文作者表示所有代码、数据集和预训练模型将在论文发表后开源。该研究部分由MIT晨兴设计学院奖学金和MIT MathWorks奖学金资助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2498339.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…