深入理解Mysql索引底层数据结构与算法

news2025/8/6 12:57:10

索引是帮助MySQL高效获取数据的排好序的数据结构

深入理解Mysql索引底层数据结构与算法

  • 1.常见的数据结构讲解
    • 1.1 二叉树
      • 1.1.1 二叉树的定义
      • 1.1.2 二叉树示例
      • 1.1.3 Mysql为什么不使用二叉树进行数据存储
    • 1.2 红黑树
      • 1.2.1 红黑树的定义
      • 1.2.2 红黑树示例
      • 1.2.3 Mysql 为什么不适用红黑树进行数据存储
    • 1.3 Hash表
    • 1.4 B-Tree
      • 1.4.1 B-Tree的定义
      • 1.4.2 B-Tree示例
      • 1.4.3 Mysql为何不适用B-Tree
    • 1.5 B+Tree
      • 1.5.1 B+Tree的定义
      • 1.5.2 B+Tree 示例

1.常见的数据结构讲解

1.1 二叉树

1.1.1 二叉树的定义

二叉树(binary tree)是指树中节点的度不大于2的有序树,它是一种最简单且最重要的树。二叉树的递归定义为:二叉树是一棵空树,或者是一棵由一个根节点和两棵互不相交的,分别称作根的左子树和右子树组成的非空树;左子树和右子树又同样都是二叉树

1.1.2 二叉树示例

非叶子结点的左边指向小于其关键字的子树,右边指向大于其关键字的子树
在这里插入图片描述

在这里插入图片描述
上图我在查找6的时候需要进行6次查询 才能找到6 元素

1.1.3 Mysql为什么不使用二叉树进行数据存储

在存储过程中二叉树 可能会蜕变成链表的形式 如1.1.2 图示例 此时查找数据就几乎和全表扫描没有区别 就使得当前的二叉树变得不平衡 那么要想满足查询效率 就需要在数据插入的时候进行二叉树的平衡 很显然这个效率是低下的 这就是mysql 为什么没有使用二叉树来做索引的数据结构存储

1.2 红黑树

1.2.1 红黑树的定义

红黑树实则是对二叉树的一个优化 会自动平衡也叫(二叉平衡树) 其中每个节点都带有颜色属性(通常是红色或黑色)。这种树的自平衡性质使得红黑树在插入和删除操作时能够保持比较好的性能。

1.2.2 红黑树示例

在这里插入图片描述

1.2.3 Mysql 为什么不适用红黑树进行数据存储

随着数据的增多,红黑树的高度会越来越高 当我需要查找一个叶子节点需要进行查找的次数会变得很多 在树的高度不可控的情况下 随着数据的增多树的高度会变高 效率也就会变低

1.3 Hash表

1.4 B-Tree

1.4.1 B-Tree的定义

B-Tree 是一种自平衡的树形数据结构也是人们常说中的B树 ,用于存储数据并保证数据的快速检索

B树的特点在于它的节点可以拥有多个子节点,并且每个节点可以拥有多个关键字,这使得B树可以存储大量的数据。B树的节点被设计成可以存储多个关键字和指向子节点的指针,这使得B树可以在一个节点中存储更多的关键字,从而减少了树的深度和查找次数。

节点中的数据索引从左到右递增排列

1.4.2 B-Tree示例

在这里插入图片描述

1.4.3 Mysql为何不适用B-Tree

B-Tree没有内部节点和叶子结点的区分,它的每个节点都是即存了key又存了data,由于没有内部节点和叶子结点的区分,使得B树没有将叶子结点用链表串联起来的结构。
因为B树不管叶子节点还是非叶子节点,都会保存数据,这样导致在非叶子节点中能保存的指针数量变少,指针少的情况下要保存大量数据,只能增加树的高度,导致IO操作变多,查询性能变低。

1.5 B+Tree

1.5.1 B+Tree的定义

用于高效地存储和检索数据。它是一种平衡树,其中每个节点都有多个子节点。B+树是一种多叉树,它的特点是每个节点都有多个子节点和多个关键字,并且每个关键字都对应一个指针,指向子节点中的某一个

  • 非叶子节点不存储数据,只存储索引,可以存放更多的索引
  • 叶子节点包含所有索引字段
  • 叶子节点用指针连接,提高区间访问的性能
  • 节点中的数据从左到右依次递增

1.5.2 B+Tree 示例

查看mysql文件页大小(16K):SHOW GLOBAL STATUS like 'Innodb_page_size'
请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/394150.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

k8s学习之路 | k8s 工作负载 ReplicaSet

文章目录1. ReplicaSet 基础概念1.1 RS 是什么?1.2 RS 工作原理1.3 什么时候使用 RS1.4 RS 示例1.5 非模板 Pod 的获得1.6 编写 RS1.7 使用 RS1.8 RS 替代方案2. ReplicaSet 与 ReplicationController2.1 关于 RS、RC2.2 两者的选择器区别2.3 总结1. ReplicaSet 基础…

【三维几何学习】使用VTK对网格输入特征进行可视化

使用VTK对网格输入特征进行可视化引言一、全部代码二、可视化引言 使用python调用VTK库对网格的输入特征进行可视化,方便后续实验与分析 上图可视化的输入特征是热核特征HKS的第一个通道,也可对其他输入进行可视化数据集可参考1:三角网格(Triangular Me…

网上鲜花交易平台,可运行

文章目录项目介绍一、项目功能介绍1、用户模块主要功能包括:2、商家模块主要功能包括:3、管理员模块主要功能包括:二、部分页面展示1、用户模块部分功能页面展示2、商家模块部分功能页面展示3、管理员模块部分功能页面展示三、部分源码四、底…

LCMXO3L-640E-5MG121I【FPGA】LCMXO3L-640E-6MG121I采用65nm非易失性低功耗工艺设计

LCMXO3L-640E-5MG121I【FPGA】LCMXO3L-640E-6MG121I采用65nm非易失性低功耗工艺设计MachXO3设备系列是一个超低密度系列,支持最先进的可编程桥接和IO扩展。它具有突破性的IO密度和最低的每IO成本。设备IO功能集成了对最新行业标准IO的支持。121CSFBGA(明…

plg(Loki+Promtail+Grafana)监控nginx日志、messages日志监控平台

登录官网:loki官网Like Prometheus, but for logs. Contribute to grafana/loki development by creating an account on GitHub.https://github.com/grafana/loki/releases/ loki安装 ----root用户操作 ###创建用户 useradd loki passwd loki###创建安装目录 mkd…

蒙牛联合泛微采知连,实现研发知识管理数智化

蒙牛1999年成立于内蒙古自治区,总部位于呼和浩特,是全球乳业七强。蒙牛常温事业部坚持产品的创新研发和数智化转型,每年持续、稳定的新品推出,让业务快速增长、规模持续扩大。 (图片素材来自蒙牛官网) 构建…

基于单片机的波形发生器设计

单片机可以用来设计各种类型的波形发生器,下面是一种基于单片机的波形发生器设计方案。所需材料:单片机:可以选择常见的Atmel AVR单片机,如ATmega328P等。调制器:可以使用AD9833或AD9851等常用的调制器。时钟&#xff…

部署安装Nginx服务实例

其他服务: 搭建zabbix4.0监控服务实例 普罗米修斯监控mysql数据库实战 Linux安装MySQL数据库步骤 一. Nginx概念介绍 1.介绍Nginx程序 Nginx (engine x) 是一款开源且高性能的HTTP和反向代理web服务器,同时也提供了IMAP/POP3/SMTP服务。主要特点是占用…

ElasticSearch - 分布式文档索引、搜索、更新和删除文档的过程

文章目录1. 分布式文档存储1. 路由一个文档到一个分片中2. 主分片和副本分片如何交互3. 新建、索引和删除文档4. 取回一个文档5. 局部更新文档2. ElasticSearch相关问题1. 路由计算方式?2. 分片控制3. 分布式文档写入(索引)的过程?4. 分布式文档搜索的过…

自动化实战以及自动化性能测试

web自动化测试实战编写web自动化测试用例;创建自动化项目,根据用例来实现脚本无头模式使用selenium4自动化测试工具和junit5单元测试框架结合,如何实现的,以及有什么两点使用了junit5中提供的注解;避免生成过多的对象&…

轻量简单的团队协作工具有哪些?远程办公必备软件排行榜

前段时间的疫情不断反复,让不少企业和团队都开启了居家办公,无论是线上协作还是团队会议,都要使用大量的办公远程软件,因为突如其来的场景大转变,所以无形中也给大家增加了不少烦恼。 经历过了就有经验了,…

Docker安装Jenkins练习纪录一

Docker安装Jenkins练习记录参考博客准备资源centos7下载vmware下载jdk8下载Maven 下载FinalShell下载开始练习一些小问题参考博客 https://blog.csdn.net/lzc2644481789/article/details/124888223 https://blog.csdn.net/qq_52423918/article/details/125169577 准备资源 cen…

2023年天津体育学院专升本专业课考试考生考前防疫及入场须知

天津体育学院2023年高职升本科专业考试考生考前须知 一、防疫要求 1.考生要强化自我健康“第一责任人”的意识和责任,自觉履行考前每日健康监测义务。须于考前7天(3月8日前)下载《天津体育学院2023年高职升本科专业考试考生健康安全承诺书》&…

【微信小程序开发全流程】篇章0:基于JavaScript开发的校园综合类微信小程序的概览

基于JavaScript开发的校园综合类微信小程序的概览 本文仅供学习,未经同意请勿转载 一些说明:上述项目来源于笔者我本科大三阶段2019年电子设计课程项目,在这个项目中,我主要是负责的部分有前端,前后端的对接&#xf…

深入理解机器学习——偏差(Bias)与方差(Variance)

分类目录:《深入理解机器学习》总目录 偏差(Bias)与方差(Variance)是解释学习算法泛化性能的一种重要工具。偏差方差分解试图对学习算法的期望泛化错误率进行拆解,我们知道,算法在不同训练集上学…

兴达易控Modbus转Profinet网关连接1200Profinet转modbus接三菱A800变频器案例

下面介绍A800 变频器通过兴达易控modbus转profinet网关,使1200plc无需编程实现Profinet转modbus协议转换,把modbus变频器轻松组网 网络拓扑如下图 打开博图组态加载GSD文件,modbus转profinet网关从站接口接入到1200PLC上 配置modbus转profine…

【MyBatis】篇二.MyBatis查询与特殊SQL

文章目录1、MyBatis获取参数值case1-单个字面量类型的参数case2-多个字面量类型的参数case3-map集合类型的参数case4-实体类类型的参数case5-使用Param注解命名参数总结2、MyBatis的各种查询功能case1-查询结果是一个实体类对象case2-查询结果是一个List集合case3-查询单个数据…

杂记——16.idea中导入maven项目

这篇文章我们来讲一下如何从Gitee上拉取项目,并将该项目导入到idea中 目录 1.拉取项目 2.idea导入项目 3.更改相关的配置 3.1更改maven仓库 3.2更改数据库的连接池 1.拉取项目 第一步:找到相关的项目地址 如图所示,在Gitee上找到相关的…

FPGA时序约束(二)利用Quartus18对Altera进行时序约束

系列文章目录 FPGA时序约束(一)基本概念入门及简单语法 文章目录系列文章目录前言Quartus时序约束不进行时序约束的后果时序约束方法TimeQuest Timing Analyzer 工具来对工程添加约束。创建网表读取SDC文件创建时钟(Create Clock&#xff09…

八股总结(三)操作系统内存管理、进程线程、进程同步与通信、中断与异常、常用命令

layout: post title: 八股总结(三)操作系统内存管理、进程线程、进程同步与通信、中断与异常、常用命令 description: 八股总结(三)操作系统内存管理、进程线程、进程同步与通信、中断与异常、常用命令 tag: 八股总结 文章目录操作…