Starrocks的主键表涉及到的MOR Delete+Insert更新策略

Starrocks的主键表涉及到的MOR Delete+Insert更新策略

news2026/5/25 6:19:42

背景

写这个文章的作用主要是做一些总结和梳理，特别是正对大数据场景下的实时写入更新策略 COW 和 MOR 以及 Delete+Insert 的技术策略的演进，
这也适用于其他大数据的计算存储系统。该文章主要参考了Primary Key table.

分析总结

Starrocks 的主键表主要是用来加速实时更新的效率，以及在做Adhoc查询的时候能够加速查询速度。在paimon等数据表格式中，一开始都是采用的MOR的策略来达到实时写入的目的，但是在读取的时候，就得进行合并的操作才能获取真正的数据，这种方式虽然能加速数据的写入速度，但是在读取的时候就会比较慢，采用Delete+Insert的方式，只会在写入的时候在DelVector增加一个标志位，读取的时候，只读最新的数据即可。大大的缩短了，数据读取的时间。

Starrocks的Unique表和Aggreate表采用的是 MOR 的策略,这个会存在读放大的问题。除此之外，由于存在Merge操作,谓词和索引也不能下推到底层的数据源中，即使下推了，也不能起到过滤的作用，这个严重的影响到了查询的效率。

对于Starrocks的主键索引，读写主键表的路程如下（参考Starrocks的官方文档)：

对于写: Starrocks 先把对应的tablets的主键索引加载到内存，对于删除操作，Starrocks首先使用主键索引找到每行对应的数据位置,并在DelVector中把数据行标记为删除。对于更新操作，会转换为Delete + insert操作，除了在DelVector增加删除标志外，还会写入最新的数据，同时主键索引也会被更新。
对于读: 由于历史的数据在写入的时候，已经被标志为了删除，所以只需要读取主键索引对应的信息就可以了，历史数据不需要再进行合并了。并且当底层的数据扫描的时候，可以利用谓词以及各种索引去减少扫描的数据量。因此查询性能得到大大的提升。

注意：

DelVector 是 Rowset 级别的
主键索引会记录pk到rowsetId + segementId + rowId的映射关系

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2375282.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

《操作系统真象还原》第十四章（2）——文件描述符、文件操作基础函数

《操作系统真象还原》第十四章（2）——文件描述符、文件操作基础函数

文章目录前言文件描述符简介文件描述符原理文件描述符实现修改thread.h修改thread.c 文件操作相关的基础函数inode操作相关函数文件相关函数编写file.h编写file.c 目录相关函数完善fs/dir.h编写fs/dir.c 路径解析相关函数实现文件检索功能修改fs.h继续完善fs.c makefile 结语 …

阅读更多...

EMQX v5.0通过连接器和规则同步数据

EMQX v5.0通过连接器和规则同步数据

1 概述 EMQX数据集成功能，帮助用户将所有的业务数据无需额外编写代码即可快速完成处理与分发。数据集成能力由连接器和规则两部分组成，用户可以使用数据桥接或 MQTT 主题来接入数据，使用规则处理数据后，再通过数据桥接将数据发…

阅读更多...

2. 盒模型/布局模块 - 响应式产品展示页_案例：电商产品网格布局

2. 盒模型/布局模块 - 响应式产品展示页_案例：电商产品网格布局

2. 盒模型/布局模块 - 响应式产品展示页案例：电商产品网格布局 <!DOCTYPE html> <html><head><meta charset"utf-8"><title></title></head><style type"text/css">:root {--primary-color…

阅读更多...

LVGL的三层屏幕结构

LVGL的三层屏幕结构

文章目录 🌟 LVGL 的三层屏幕架构1. **Top Layer（顶层）**2. **System Layer（系统层）**3. **Active Screen（当前屏幕层）** 🧠 总结对比🔍 整体作用✅ 普通屏幕层对象&…

阅读更多...

【PDF】使用Adobe Acrobat dc添加水印和加密

【PDF】使用Adobe Acrobat dc添加水印和加密

【PDF】使用Adobe Acrobat dc添加水印和加密文章目录 [TOC](文章目录) 前言一、添加保护加密口令二、添加水印三、实验四、参考文章总结实验工具： 1.Adobe Acrobat dc 前言提示：以下是本篇文章正文内容，下面案例可供参考一、添加保护加…

阅读更多...

Windows下安装mysql8.0

Windows下安装mysql8.0

一、下载安装离线安装包 （下载过了，可以跳过） 下载网站：MySQL :: Download MySQL Installerhttps://dev.mysql.com/downloads/installer/ 二、安装mysql 三、安装完成验证

阅读更多...

水滴Android面经及参考答案

水滴Android面经及参考答案

static 关键字有什么作用，它修饰的方法可以使用非静态的成员变量吗？ static关键字在 Java 中有多种作用。首先，它可以用来修饰变量，被static修饰的变量称为静态变量。静态变量属于类，而不属于类的某个具体实例&#xf…

阅读更多...

工程师必读！ 3 个最常被忽略的 TDR 测试关键细节与原理

工程师必读！ 3 个最常被忽略的 TDR 测试关键细节与原理

TDR真的是一个用来看阻抗跟Delay的好工具，通过一个Port的测试就可以看到通道各个位置的阻抗变化。可是使用上其实没这么单纯，有很多细节需要非常地小心，才可以真正地看到您想看的信息！ 就让我们整理3个极为重要的TDR使用小细节&…

阅读更多...

C++中的各式类型转换

C++中的各式类型转换

隐式转换： 基本类型的隐式转换： 当函数参数类型非精确匹配，但是可以转换的时候发生如： void func1(double x){cout << x << endl; }void func2(char c){cout << c << endl; }int main(){func1(2);//…

阅读更多...

Nacos源码—9.Nacos升级gRPC分析七

Nacos源码—9.Nacos升级gRPC分析七

大纲 10.gRPC客户端初始化分析 11.gRPC客户端的心跳机制(健康检查) 12.gRPC服务端如何处理客户端的建立连接请求 13.gRPC服务端如何映射各种请求与对应的Handler处理类 14.gRPC简单介绍 10.gRPC客户端初始化分析 (1)gRPC客户端代理初始化的源码 (2)gRPC客户端启动的源码…

阅读更多...

【计算机视觉】基于深度学习的实时情绪检测系统：emotion-detection项目深度解析

【计算机视觉】基于深度学习的实时情绪检测系统：emotion-detection项目深度解析

基于深度学习的实时情绪检测系统：emotion-detection项目深度解析 1. 项目概述2. 技术原理与模型架构2.1 核心算法1) 数据预处理流程2) 改进型MobileNetV2 2.2 系统架构 3. 实战部署指南3.1 环境配置3.2 数据集准备3.3 模型训练3.4 实时推理 4. 常见问题与解决方案4.…

阅读更多...

【图像处理基石】什么是油画感？

【图像处理基石】什么是油画感？

在图像处理中，“油画感”通常指图像呈现出类似油画的块状纹理、笔触痕迹或色彩过渡不自然的现象，表现为细节模糊、边缘不锐利、颜色断层或人工纹理明显。这种问题常见于照片处理、视频帧截图或压缩后的图像，本质是画质受损的一种表现。以下是…

阅读更多...

AD PCB布线的常用命令

AD PCB布线的常用命令

PCB布线顺序：先信号，再电源，再GNG 1.多根走线的应用将IC上的引脚分类更改一类引脚以及引线的颜色，画出走线（将脚引出） 选中这些走线，点击‘交互式总线布线’，便可以多根拉线 shi…

阅读更多...

【3-2】HDLC

【3-2】HDLC

前言前面我们提到了 PSTN（Public Switched Telephone Network） ，今天介绍一种很少见的数据链路层的协议，HDLC！ 文章目录前言1. 定义2. 帧边界3. 零比特填充4. 控制字段4.1. 信息帧（I帧）4.2. …

阅读更多...

MySQL 学习（八）如何打开binlog日志

MySQL 学习（八）如何打开binlog日志

目录一、默认状态二、如何检查 binlog 状态三、如何开启 binlog3.1 临时开启（重启后失效）3.2 永久开启（需修改配置文件）3.3 验证是否开启成功3.4 查看 binlog 内容四、高级配置建议五、注意事项六、开启后的日常维护知识回顾&a…

阅读更多...

OpenCV进阶操作：光流估计

OpenCV进阶操作：光流估计

文章目录前言一、光流估计1、光流估计是什么？2、光流估计的前提？1）亮度恒定2）小运动3）空间一致 3、OpenCV中的经典光流算法1）Lucas-Kanade方法（稀疏光流）2） Farneback方…

阅读更多...

4. 文字效果/2D-3D转换 - 3D翻转卡片

4. 文字效果/2D-3D转换 - 3D翻转卡片

4. 文字效果/2D-3D转换 - 3D翻转卡片案例：3D产品展示卡片 <!DOCTYPE html> <html><head><meta charset"utf-8"><title></title></head><style type"text/css">.scene {width: 300px;height…

阅读更多...

【AI News | 20250513】每日AI进展

【AI News | 20250513】每日AI进展

AI Repos 1、iap-diffusion-labs 从零开始带我们构建完整的扩散模型。通过三个精心设计的实验练习，循序渐进地引导我们实现流匹配和扩散模型，从基础 SDE 到条件图像生成，每一步都有详尽指导和完整代码，让复杂理论简单易懂。主要内…

阅读更多...

mybatisplus 集成逻辑删除

mybatisplus 集成逻辑删除

一开始，没去查资料，后面要被AI气死了，先看它的的话一开始，看ai的描述，我还以为，不需要改数据库，mybatis-puls自动拦截集成就可以实现逻辑删除，c，最后还是要给数据库加一…

阅读更多...

SimScape物理建模实例2--带控制的单质量弹簧阻尼系统

SimScape物理建模实例2--带控制的单质量弹簧阻尼系统

模型下载： 基于simscape，单质量系统带位置控制资源-CSDN文库在实例1中，我们搭建了不带控制的单质量弹簧阻尼系统，该系统没有外界力量介入，只有弹簧的初始弹力，带着弹簧使劲弹来弹去。 SimScape物理建模实…

阅读更多...

推荐文章

最新文章