Mysql 索引概述

news2025/5/21 0:23:39

索引(index)是帮助Mysql高效获取数据的数据结构

索引优点:1. 提高排序效率  2. 提高查询效率

索引缺点:1.索引占用空间(可忽略)2.索引降低了更新表的速度,如进行insert,update,delette 时效率降低(也可忽略,因为实际很少用,大部分还是select)

我们平常所说的索引,如果没有特别指明,都是B+树结构组织的索引

B+树 

1.所有的数据都会出现在叶子结点

2.叶子结点形成一个单向链表 

 键值是不存储数据的,数据存储在叶子结点上

非叶子节点:仅存储索引值(键) ,不存储实际数据。

叶子节点:存储索引值和实际数据 。

查找过程

  • 定位叶子节点:从根节点开始,根据待查找的键值与非叶子节点中键值的比较结果,选择对应的子节点指针向下层查找 ,不断重复这个过程,直到找到叶子节点 。
  • 在叶子节点查找:在叶子节点中,由于叶子节点存储了数据或指向数据的指针,所以可以在叶子节点中找到目标数据 。如果是范围查询,比如查找某个区间内的用户记录,找到区间起始值对应的叶子节点后,通过叶子节点间的双向链表顺序遍历,就能获取该区间内的所有数据 。

哈希索引

优点

  • 等值查询速度极快:在理想状况下(不发生哈希冲突),哈希索引的查找时间复杂度为 O (1) ,能在常数时间内直接定位目标记录。比如在用户表中,查找用户 ID 为特定值的记录时,使用哈希索引可迅速找到对应数据,比一些树形索引结构(如 B - 树、B + 树 )更高效 。这是因为哈希索引通过哈希函数直接计算出存储位置,无需像树结构那样逐层查找 。
  • 适合精确匹配场景:特别适用于精确匹配查询,像查找特定订单号、某个具体的商品编号等场景 。只要给出准确的键值,就能快速定位到对应的数据行 。
  • 实现相对简单:相比一些复杂的树形索引结构(如 B + 树 ),哈希索引的原理和实现方式较为简单 。其主要依赖哈希函数和哈希表来组织和查找数据 。
  • 缓存场景应用佳:由于查找速度快,在高频率的缓存场景中表现出色 。例如在缓存系统中,使用哈希索引能快速判断缓存中是否存在目标数据,提升缓存的读写率 。

缺点

  • 不支持范围查询:哈希算法无法维护数据的排序关系,所以哈希索引仅适用于等值查询,不支持范围查询(如 <、>、BETWEEN 等操作 ) 。
  • 存在哈希冲突问题:哈希函数可能将多个不同的键值映射到相同的位置,即产生哈希冲突 。解决哈希冲突通常采用链表法(将冲突的键值存储在链表中 )、开放地址法等 。但即便如此,哈希冲突仍可能导致性能下降,比如使用链表法解决冲突时,若链表过长,查询效率会受到影响 。
  • 无法支持排序操作:因为哈希索引没有维护元素的顺序,所以无法直接支持 ORDER BY 或 GROUP BY 操作 。如果需要对数据进行排序或分组,必须在查询后对结果集进行额外处理 。
  • 内存开销较大:通常需要较大的内存来存储哈希表,尤其是数据量较大时,内存占用会更加显著 。这限制了它在一些内存资源有限环境中的应用 。
  • 存储引擎支持有限:在 MySQL 中,只有 MEMORY 存储引擎直接支持哈希索引 ,InnoDB 和 MyISAM 等常用存储引擎不直接支持 。虽然 InnoDB 提供了自适应哈希索引(在某些条件下自动创建 ),但并非完全等同于手动创建的哈希索引 。

为什么InnoDB引擎选择使用B+tree索引结构?

1.相对于二叉树来说层级更少,搜索效率高

2.B-tree 不管是叶子结点还是非叶子结点,都会存储数据,这样导致一页中存储的键值减少,指针跟着减少,在相同数据量的情况下占用了更多的空间。

3.相对于Hash索引,B+tree支持范围匹配及排序操作

索引分类

分类含义特点关键字
主键索引针对于表中主键创建的索引默认自动创建,只能有一个PRIMARY
唯一索引避免同一个表中某数据列中的值重复可以有多个UNIQUE
常规索引快速定位特定数据可以有多个
全文索引全文索引查找的是文本中的关键词,而不是比较索引中的值可以有多个FULLTEXT

在 InnoDB 存储引擎中,根据索引的存储形式,又可以分为以下两种:

分类含义特点
聚集索引 (Clustered Index)将数据存储与索引放到了一块,索引结构的叶子节点保存了行数据必须有,而且只有一个
二级索引 (Secondary Index)将数据与索引分开存储,索引结构的叶子节点关联的是对应的主键可以存在多个

 

聚集索引选取规则:

  • 如果存在主键,主键索引就是聚集索引。
  • 如果不存在主键,将使用第一个唯一(UNIQUE)索引作为聚集索引。
  • 如果表没有主键,或没有合适的唯一索引,则 InnoDB 会自动生成一个 rowid 作为隐藏的聚集索引。

看这条语句的查询过程 select * from user where name='Arm';

  • 先在二级索引里 Arm与Lee与比 ,A在L之前,去前面找,找到Arm之后获得存储的数据10,然后10再去聚集索引中来比较,找到10这个索引所储存的数据

每一个节点最终落在磁盘上就会存放在一个页当中,一个页的大小是固定的16k,那么一个页存储的数据就是有限的

非叶子结点能存放多少key和指针,非叶子结点不存放数据,只存放key和指针,并且指针永远比key多一个

一行数据大小为 1k,一页中可以存储 16 行这样的数据。InnoDB 的指针占用 6 个字节的空间,主键即使为 bigint,占用字节数为 8,n代表当前结点存储的key的数量。

n*8+(n+1)*6=16*1024    解得:n=1170 

所以一个结点能存储1170个key,有1171个指针,每一个指针指向下面的一个子结点,一个子结点能存储16行数据,如果树的高度为2,那么能存储的数据量就是1171*16=18736

如果树的高度为3 ,则能存储的数据量就是1171*1171*16=21,939,856

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2380338.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

解决RAGFlow部署中镜像源拉取的问题

报错提示 Error response from daemon: Get "https://registry-1.docker.io/v2/ ": context deadline exceeded 解决方法 这个原因是因为拉取镜像源失败&#xff0c;可以在/etc/docker/daemon.json文件中添加镜像加速器&#xff0c;例如下面所示 {"registry…

uniapp打包H5,输入网址空白情况

由于客户预算有限&#xff0c;最近写了两个uniapp打包成H5的案例&#xff0c;总结下面注意事项 1. 发行–网站-PCWeb或手机H5按钮&#xff0c;输入名称&#xff0c;网址 点击【发行】&#xff0c;生成文件 把这个给后端&#xff0c;就可以了 为什么空白呢 最重要一点&#xf…

C++(21):fstream的读取和写入

目录 1 ios::out 2 ios::in和is_open 3 put()方法 4 get()方法 4.1 读取单个字符 4.2 读取多个字符 4.3 设置终结符 5 getline() 1 ios::out 打开文件用于写入数据。如果文件不存在&#xff0c;则新建该文件&#xff1b;如果文件原来就存在&#xff0c;则打开时清除…

NAT/代理服务器/内网穿透

目录 一 NAT技术 二 内网穿透/内网打洞 三 代理服务器 一 NAT技术 跨网络传输的时候&#xff0c;私网不能直接访问公网&#xff0c;就引入了NAT能讲私网转换为公网进行访问&#xff0c;主要解决IPv4(2^32)地址不足的问题。 1. NAT原理 当某个内网想访问公网&#xff0c;就必…

Unity 多时间源Timer定时器实战分享:健壮性、高效性、多线程安全与稳定性能全面解析

简介 Timer 是一个 Unity 环境下高效、灵活的定时任务调度系统&#xff0c;支持以下功能&#xff1a; •支持多种时间源&#xff08;游戏时间 / 非缩放时间 / 真实时间&#xff09; •支持一次性延迟执行和重复执行 •提供 ID、回调、目标对象等多种查询和销毁方式 •内建…

【iOS】探索消息流程

探索消息流程 Runtime介绍OC三大核心动态特性动态类型动态绑定动态语言 方法的本质代码转换objc_msgSendSELIMPMethod 父类方法在子类中的实现 消息查找流程开始查找快速查找流程慢速查找流程二分查找方法列表父类缓存查找 动态方法解析动态方法决议实例方法类方法优化 消息转发…

413 Payload Too Large 问题定位

源头 一般是服务器或者nginx 配置导致的 nginx http {client_max_body_size 50m; # 调整为所需大小&#xff08;如 50MB&#xff09;# 其他配置... }nginx 不配置&#xff0c;默认是1M 服务器 spring 不配置也是有默认值的好像也是1M 如果出现413 可以试着修改配置来避…

2025年渗透测试面试题总结-360[实习]安全工程师(题目+回答)

网络安全领域各种资源&#xff0c;学习文档&#xff0c;以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具&#xff0c;欢迎关注。 目录 1. 自我介绍 2. WAF及其绕过方式 3. IPS/IDS/HIDS 4. 云安全 5. 绕过安骑士/安全狗 6. Gopher扩展…

Ubuntu16.04升级gcc/g++版本方法

0 前言 gcc与g分别是GNU的c和c编译器&#xff0c;Ubuntu16.04默认的gcc和g的版本是5.4.0&#xff0c;在使用一些交叉编译工具链会提示找不到GLIBC_2.27&#xff0c;而GLIBC_2.27又需要gcc 6.2以上版本&#xff0c;因此本文介绍Ubuntu16.04升级gcc/g版本的方法。 1 Ubuntu16.0…

微信小程序van-dialog确认验证失败时阻止对话框的关闭

使用官方(Vant Weapp - 轻量、可靠的小程序 UI 组件库)的before-close&#xff1a; wxml&#xff1a; <van-dialog use-slot title"名称" show"{{ show }}" show-cancel-button bind:cancel"onClose" bind:confirm"getBackInfo"…

OceanBase 的系统变量、配置项和用户变量有何差异

在继续阅读本文之前&#xff0c;大家不妨先思考一下&#xff0c;数据库中“系统变量”、“用户变量”以及“配置项”这三者之间有何不同。如果感到有些模糊&#xff0c;那么本文将是您理清这些概念的好帮手。 很多用户在使用OceanBase数据库中的“配置项”和“系统变量”&#…

【Python】Jupyter指定具体路径

一、右键Jupyter Notebook 右击Jupyter Notebook点击属性 二、修改以下两个地方

RNope:结合 RoPE 和 NoPE 的长文本建模架构

TL;DR 2025 年 Cohere 提出的一种高效且强大的长上下文建模架构——RNope-SWA。通过系统分析注意力模式、位置编码机制与训练策略&#xff0c;该架构不仅在长上下文任务上取得了当前最优的表现&#xff0c;还在短上下文任务和训练/推理效率方面实现了良好平衡。 Paper name …

virtualbox虚拟机中的ubuntu 20.04.6安装新的linux内核5.4.293 | 并增加一个系统调用 | 证书问题如何解决

参考文章&#xff1a;linux添加系统调用【简单易懂】【含32位系统】【含64位系统】_64位 32位 系统调用-CSDN博客 安装新内核 1. 在火狐下载你需要的版本的linux内核压缩包 这里我因为在windows上面下载过&#xff0c;配置过共享文件夹&#xff0c;所以直接复制粘贴通过共享文…

unity UGUI虚线框shader

Shader "Custom/DottedLineShader" {Properties{_MainTex ("Texture", 2D) "white" {}_Color("Color",COLOR) (1,1,1,1)_LineLength("虚线长度",float) 0.08}SubShader{Tags //设置支持UGUI{ "Queue""Tran…

chirpstack v4版本 全流程部署[ubuntu+docker]

背景介绍 由于chirpstackv3 版本使用的是锐米提供的版本,从网络上寻找的资源大多数都是一样的v3版本,是经过别人编译好发布出来的,原本的chirpsatck项目是运行的linxu环境下的,因此我的想法是在linux服务器上部署chirpsatckv4,暂时使用linux上的chirpstack v4版本,目前编译成e…

数字信号处理-大实验1.1

MATLAB仿真实验目录 验证实验&#xff1a;常见离散信号产生和实现验证实验&#xff1a;离散系统的时域分析应用实验&#xff1a;语音信号的基音周期&#xff08;频率&#xff09;测定 目录 一、常见离散信号产生和实现 1.1 实验目的 1.2 实验要求与内容 1.3 实验…

对抗性机器学习:AI模型安全防护新挑战

随着采用对抗性机器学习&#xff08;Adversarial Machine Learning, AML&#xff09;的AI系统融入关键基础设施、医疗健康和自动驾驶技术领域&#xff0c;一场无声的攻防战正在上演——防御方不断强化模型&#xff0c;而攻击者则持续挖掘漏洞。2025年&#xff0c;对抗性机器学习…

[[春秋云境] Privilege仿真场景

文章目录 靶标介绍&#xff1a;知识点卷影拷贝(VSS) 外网任意文件读取Jenkins管理员后台rdp远程登录Gitlab apiToken 内网搭建代理 Oracle RCESeRestorePrivilege提权mimikatzspn卷影拷贝提取SAM 参考文章 靶标介绍&#xff1a; 在这个靶场中&#xff0c;您将扮演一名资深黑客…

Redis学习打卡-Day3-分布式ID生成策略、分布式锁

分布式 ID 当单机 MySQL 已经无法支撑系统的数据量时&#xff0c;就需要进行分库分表&#xff08;推荐 Sharding-JDBC&#xff09;。在分库之后&#xff0c; 数据遍布在不同服务器上的数据库&#xff0c;数据库的自增主键已经没办法满足生成的主键全局唯一了。这个时候就需要生…