3D Gaussian Splatting as MCMC 与gsplat中的应用实现

news2025/5/13 7:25:33

3D高斯泼溅(3D Gaussian splatting)自2023年提出以后,相关研究paper井喷式增长,尽管出现了许多改进版本,但依旧面临着诸多挑战,例如实现照片级真实感、应对高存储需求,而 “悬浮的高斯核” 问题就是其中之一。浮动高斯核通常由输入图像中的曝光或颜色不一致引发,也可能源于运动恢复结构(SfM)过程中产生的离群值。此外,严格意义上的高斯泼溅更偏向于 3D 重建而非新视图合成,它仅能为输入图像序列覆盖良好的场景部分生成新视角。

本文将聚焦于 3D 高斯泼溅的一个实际应用 ——高斯泼溅中的物体插入,并详细解读论文《3D Gaussian Splatting as Monte Carlo Markov Chain》,详见 3dgs-mcmc/,进一步展示MCMC与3dgs结合在gsplat第三方工具中的应用。

0. 3DGS MCMC 简介

3DGS 作为 MCMC 论文的前提如下:

  • ADC 的概率概念:尽管自适应密度控制 (ADC) 是一种有效的致密化和修剪策略,但它缺乏坚实的数学基础。MCMC 引入了一个概率框架来解决这一缺陷。
  • 收敛与探索: MCMC 论文并不单纯依赖基于优化的方法,而是将优化与探索相结合,从而能够找到问题的多个最优解决方案。
  • 将死高斯变为活高斯: ADC 启发式方法被通过重新定位死高斯来实现的状态转换所取代。
  • 引入正则化:论文还向损失函数引入了两种正则化:尺度正则化不透明度正则化

3d 高斯溅射训练 MCMC + 双边网格 3D 高斯溅射作为马尔可夫链蒙特卡洛无浮动高斯溅射

图 1:3DGS 与 3DGS + MCMC 的比较

本文从回顾 MCMC 开始,逐步引入到3DGS中。

1. MCMC概念回顾

MCMC 抽样是一种众所周知的近似算法,在机器学习中,广泛应用于概率建模。MCMC 的全称是蒙特卡洛马尔可夫链。蒙特卡洛和马尔可夫链是两种不同的算法。

有时,由于诸如空间复杂性、高维性等原因,一些积分和很难直接计算。在这些情况下,我们会对其进行近似——要么采用采样方法,比如MCMC,要么使用参数化分布,就像在变分推断中所做的那样。

例如,在贝叶斯统计中,计算后验分布需要对模型参数的所有可能值进行积分,并由先验和观测数据的似然性加权。随着参数数量的增加或似然函数变得复杂,这种积分很快就会变得难以处理。

                        先验、似然和后验 3DGS MCMC 论文解释

图 2:先验、似然和后验

从上图可以看出,先验、后验和似然在数学上的含义。

2. 3DGS中先验/似然与后验的引入

在3D 高斯泼溅 (3DGS) 的贝叶斯视图中,可以将模型参数(所有高斯泼溅的位置、大小、颜色、不透明度等)解释为随机变量。

3DGS 3d 高斯溅射训练 MCMC + 双边网格中的先验、似然和后验

图 3:3DGS 中的先验、似然和后验

  • 这些参数的先验分布p(θ)编码了在看到实际图像数据之前的任何假设偏好。例如,可能希望高斯函数的大小不受限制,或者它们的颜色位于合理范围内,或者总的 splats 数量不会激增,等等。
  • 可能性p(Data|θ) 衡量了特定的splats 配置参数θ对实际观察到的图像(训练视图)的解释程度。
  • 后验分布为:

                                        p(\theta|Data)=\frac{p(Data|\theta)p(\theta)}{p(Data)}

换句话说,后验分布就是基于数据的初始假设,然后如何通过观察到的图像数据进行更新。

3. 单纯融合 VS 融合+探索参数空间

自适应密度控制 (ADC) 是一种解决问题的启发式方法,但并未完全优化,并且缺乏坚实的数学基础。MCMC 通过为致密化和修剪策略提供更强大的数学基础来解决相同的核心问题。

具体来说,它通过将这些策略概念化为采样过程,为这些策略引入了一个概率框架。

“采样是一种通过研究大群体的一小部分来估计其整体特征的方法。”
例如,假设需要找到一条曲线下的面积(如下图所示)。通过积分计算它可能需要处理一个复杂的公式。相反,使用蒙特卡罗方法,则可以在曲线边界的矩形内随机散布红点。那么使用的点越多,估计就越准确。通过计算曲线下的点与矩形中总点数的比例,就可以确定曲线下的面积,因为这个比例对应于矩形面积的比例。”

                         高斯分布中的对象插入

图 4:蒙特卡洛估计曲线下面积

3DGS 的一般方法是:

  • 寻找单一最佳解决方案: 3DGS 遵循一种简单的优化方法。它初始化高斯函数,然后通过计算渲染图像和真实图像之间的 L1 损失来优化其配置。此损失用于更新高斯函数。然而,这种方法往往会产生单一最佳解决方案,并且可能会陷入局部最小值的问题。

MCMC 提出了一种不同的视角,它不是专注于寻找单一的最佳解决方案,而是旨在通过从后验分​​布中抽样来确定一系列能够同样好地解释数据的配置。

4. 用于概率 3DGS 建模的 MCMC

MCMC 引入了一个后验分布 G(θ),它表示在给定训练数据的情况下,高斯参数配置 g (位置、颜色、形状等)正确的概率。换句话说:

                        G(\theta)=P(\theta|Data)

这里,克\θ对应相同的配置。

这种分布G(θ) 的设计使得\θ能够很好表示场景的配置将具有较高的值 G(θ),而不能很好表示场景的配置将具有较低的G(θ)值。

通过将问题转化为从分布中进行抽样,可以使用马尔可夫链蒙特卡罗 (MCMC) 方法(如随

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2332065.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++初阶-C++的讲解1

目录 1.缺省(sheng)参数 2.函数重载 3.引用 3.1引用的概念和定义 3.2引用的特性 3.3引用的使用 3.4const引用 3.5.指针和引用的关系 4.nullptr 5.总结 1.缺省(sheng)参数 (1)缺省参数是声明或定义是为函数的参数指定一个缺省值。在调用该函数是…

STM32_USB

概述 本文是使用HAL库的USB驱动 因为官方cubeMX生成的hal库做组合设备时过于繁琐 所以这里使用某大神的插件,可以集成在cubeMX里自动生成组合设备 有小bug会覆盖生成文件里自己写的内容,所以生成一次后注意保存 插件安装 下载地址 https://github.com/alambe94/I-CUBE-USBD-Com…

STM32 的编程方式总结

🧱 按照“是否可独立工作”来分: 库/方式是否可独立使用是否依赖其他库说明寄存器裸写✅ 是❌ 无完全自主控制,无库依赖标准库(StdPeriph)✅ 是❌ 只依赖 CMSIS自成体系(F1专属),只…

MFC工具栏CToolBar从专家到小白

CToolBar m_wndTool; //创建控件 m_wndTool.CreateEx(this, TBSTYLE_FLAT|TBSTYLE_NOPREFIX, WS_CHILD | WS_VISIBLE | CBRS_FLYBY | CBRS_TOP | CBRS_SIZE_DYNAMIC); //加载工具栏资源 m_wndTool.LoadToolBar(IDR_TOOL_LOAD) //在.rc中定义:IDR_TOOL_LOAD BITMAP …

大厂机考——各算法与数据结构详解

目录及其索引 哈希双指针滑动窗口子串普通数组矩阵链表二叉树图论回溯二分查找栈堆贪心算法动态规划多维动态规划学科领域与联系总结​​ 哈希 ​​学科领域​​:计算机科学、密码学、数据结构 ​​定义​​:通过哈希函数将任意长度的输入映射为固定长度…

10:00开始面试,10:08就出来了,问的问题有点变态。。。

从小厂出来,没想到在另一家公司又寄了。 到这家公司开始上班,加班是每天必不可少的,看在钱给的比较多的份上,就不太计较了。没想到8月一纸通知,所有人不准加班,加班费不仅没有了,薪资还要降40%…

基于ueditor编辑器的功能开发之给编辑器图片增加水印功能

用户需求,双击编辑器中的图片的时候,出现弹框,用户可以选择水印缩放倍数、距离以及水印所放置的方位(当然有很多水印插件,位置大小透明度用户都能够自定义,但是用户需求如此,就自己写了&#xf…

【CSS基础】- 02(emmet语法、复合选择器、显示模式、背景标签)

css第二天 一、emmet语法 1、简介 ​ Emmet语法的前身是Zen coding,它使用缩写,来提高html/css的编写速度, Vscode内部已经集成该语法。 ​ 快速生成HTML结构语法 ​ 快速生成CSS样式语法 2、快速生成HTML结构语法 生成标签 直接输入标签名 按tab键即可 比如 div 然后tab…

【码农日常】vscode编码clang-format格式化简易教程

文章目录 0 前言1 工具准备1.1 插件准备1.2 添加.clang-format1.3 添加配置 2 快速上手 0 前言 各路大神都说clangd好,我也来试试。这篇主要讲格式化部分。 1 工具准备 1.1 插件准备 照图安装。 1.2 添加.clang-format 右键添加文件,跟添加个.h或者.c…

金融数据分析(Python)个人学习笔记(7):网络数据采集以及FNN分类

一、网络数据采集 证券宝是一个免费、开源的证券数据平台(无需注册),提供大盘准确、完整的证券历史行情数据、上市公司财务数据等,通过python API获取证券数据信息。 1. 安装并导入第三方依赖库 baostock 在命令提示符中运行&…

死锁 手撕死锁检测工具

目录 引言 一.理论联立 1.死锁的概念和原因 2.死锁检测的基本思路 3.有向图在死锁检测中的应用 二.代码实现案例(我们会介绍部分重要接口解释) 1.我们定义一个线性表来存线程ID和锁ID 2.表中数据的查询接口 3.表中数据的删除接口 4.表中数据的添…

软考高级-系统架构设计师 案例题-软件架构设计

文章目录 软件架构设计质量属性效用树,质量属性判断必背概念架构风格对比MVC架构J2EE四层结构面向服务架构SOA企业服务总线ESB历年真题【问题1】 (12分)【问题2】(13分) 参考答案历年真题【问题1】(12分)【…

vue+d3js+fastapi实现天气柱状图折线图饼图

说明: vued3jsfastapi实现天气柱状图折线图饼图 效果图: step0:postman 1. 生成天气数据(POST请求):URL: http://localhost:8000/generate-data/?year2024&month3&seed42 方法: POST Headers:Content-Type:…

vue:前端预览 / chrome浏览器设置 / <iframe> 方法预览 doc、pdf / vue-pdf 预览pdf

一、本文目标 <iframe> 方法预览 pdf 、word vue-pdf 预览pdf 二、<iframe> 方法 2.1、iframe 方法预览需要 浏览器 设置为&#xff1a; chrome&#xff1a;设置-隐私设置和安全性-网站设置-更多内容设置-PDF文档 浏览器访问&#xff1a; chrome://settings/co…

【NLP 56、实践 ⑬ LoRA完成NER任务】

目录 一、数据文件 二、模型配置文件 config.py 三、数据加载文件 loader.py 1.导入文件和类的定义 2.初始化 3.数据加载方法 代码运行流程 4.文本编码 / 解码方法    ① encode_sentence()&#xff1a; ② decode()&#xff1a; 代码运行流程 ③ padding()&#xff1a; 代码…

【力扣hot100题】(076)买卖股票的最佳时机

终于来到了最考验智商的贪心算法。 之前做过&#xff0c;但花了不少时间思考&#xff0c;所以这次做的很快。 思路就是记录最小价格&#xff0c;然后一路遍历边调整新的最小价格边比较目前价格和最小价格差价。 class Solution { public:int maxProfit(vector<int>&am…

c#的form实现叠叠乐游戏

说明&#xff1a; 我希望用c#的form实现叠叠乐的游戏&#xff0c;玩家需要堆叠方块来建造高塔。 效果图&#xff1a; step1:游戏规则 游戏实现步骤&#xff1a; a. 处理事件&#xff0c;玩家可以释放摆动的方块&#xff0c;方块会下落。 b. 更新摆动方块的位移&#xff0c;根…

Qt中的元对象系统

Qt的元对象系统(Meta-Object System)提供了对象间通信的信号和槽机制、运行时类型信息和动态属性系统。 元对象系统基于以下三个方面&#xff1a; (1).QObject类&#xff1a;为可以利用元对象系统的对象提供了基类。 (2).Q_OBJECT宏&#xff1a;用于启用元对象功能&#xff0c;…

qt之opengl使用

使用qt中的openglWidget绘制一个三角形。自定义的类继承关系sunOpengl : public QOpenGLWidget,QOpenGLFunctions_3_3_Core 代码如下 /*----MainWindow.cpp----------------------------------------------*/ #include "mainwindow.h" #include "./ui_mainwin…

晋城市电子健康证上传照片尺寸要求及手机拍照制作方法

晋城市餐饮从业人员健康证电子照片上传有着明确的技术规范。根据"晋城市从业人员电子健康证明服务平台"要求&#xff0c;照片尺寸应为358像素&#xff08;宽&#xff09;441像素&#xff08;高&#xff09;&#xff0c;这一比例符合标准证件照的规格。照片底色可选择…