对数据库索引的理解以及索引在MySQL中的数据结构

news2025/7/15 19:34:34

引言

索引在本质上相当于书的目录,通过目录就可以快速的找到某个章节对应的位置。索引的效果,就是加快了查找的速度。日常进行数据库的操作,一般地都是进行增删查改,而在很多场景中,进行查找的概率要比增删改大很多。

虽然索引可以增加查找的概率,但是也增加了增删改的开销,因为一旦进行增删改操作,那么就需要调整已经创建好的索引了。同时,索引也会增加空间的开销,因为创建索引,也需要额外的硬盘空间来保存。

使用场景

1.数据量较大,且经常对这些列进行条件查询。

2.该数据库表的插入操作,及对这些列的修改操作频率较低。

3.索引会占用额外的磁盘空间。

满足以上条件时,就可以考虑对表中的这些字段创建索引,以提高查询效率。反之,不考虑创建索引。

使用

创建主键约束(PRIMARY KEY)、唯一约束(UNIQUE)、外键约束(FOREIGN KEY)时,会自动创建对应列的索引。

1.查看索引

show index from 表名;

示例:查看学生表中已有的索引

show index from student;

2.创建索引

对于非主键、非唯一约束、非外键的字段,可以创建普通索引

create index 索引名 on 表名(字段名);

示例:创建班级表中,name字段的索引

create index idx_classes_name on classes(name);

3.删除索引

drop index 索引名 on 表名;

drop index idx_classes_name on classes;

关于创建索引,最好的就是在建表之初就创建好。对于一个已经存在非常多数据的表再来创建索引,是有很大风险的。因为数据库里面的数据量非常庞大,那么在创建索引的时候,一下子就会吃掉大量的磁盘IO,可能会持续一段时间,具体时间要根据数据量的大小来定。那么在磁盘IO被吃满的这段时间里,是无法进行任何操作的,可能会带来一定的经济损失。

关于删除索引,也是和创建索引一样,有磁盘IO被吃满的风险,所以删除索引的时候要慎重!

在索引被创建好之后,是不需要我们手动的去使用的,查询的时候会自动的用索引进行查询。SQL是通过数据库的执行引擎来进行执行的,这里面可能会涉及一些优化操作,执行引擎会自动评估哪一种方案是成本最低查询速度最快的。

索引在MySQL中的数据结构

抓住重点,数据库需要的是范围查找!

1.关于哈希表,虽然哈希表查找元素的时间度是O(1),但是哈希表只能比较相等,无法进行大于小于这样的范围查找。

2.关于二叉搜索树,二叉搜索树查找元素的时间复杂度一般情况下为O(logN),但是在最坏情况下是单枝树,相当于链表了,所以此时为O(N)。虽然二叉搜索树可以查找范围,因为树里面的元素时是有序的,根据起点和终点,可以确定范围。但是,当树中的元素非常多的时候,那么树的高度就会比较高,然后树的高度就决定了在进行查询的时候,元素的比较次数,因为数据库在进行比较的时候都是要读硬盘的,因此二叉树搜索树并不合适。

3.针对二叉搜索树的缺点,就引入了N叉搜索树,这样就解决了树的高度问题。其中一种典型的实现就是B树,每个节点上有多个值,同时有多个分叉:

关于B树,因为一个节点上存在多个值,每个节点都是在硬盘上,所以虽然比较次数没有减少,但是读写硬盘的次数明显减少了。虽然B树比较适合做数据库的索引了,但是并不是,又在此基础上做了一些改进,引入了B+树。

4.关于B+树,就是为了索引这个场景而量身定做的数据结构,它也属于N叉搜索树,但是具有一些新的特点。

结构特点:

1.B+树也是N叉搜索树,每个节点上可能包含N个key,N个key划分出N个区间,最后一个key就是最大值。

2.父元素的key会在子元素中重复出现,并且在子元素中是最大值。

3.会把叶子节点用类似于链表的方式进行首尾相连。

优势:

1.首先它也属于N叉搜索树,树的高度降了下来,在进行比较的时候,磁盘IO次数就比较少了

2.更适合进行范围查询

3.所有的查询都是要落在叶子节点上的,无论查询那个元素,中间进行比较的次数是差不多的,查询操作比较均衡。在这一点上,对于B树来说,可能有些值查询比较快,有些查询比较慢,但是对于B+树来说,查询的速度是稳定的。

4.由于所有的key都会在叶子节点中体现,只需要把所有的数据行给放到叶子节点中。

 

由于非叶子节点只存了简单的id,没有存一整行,这就意味着非叶子节点占用的空间是比较小的,也有可能非叶子节点可以放进内存中去缓存,更进一步的降低了磁盘IO次数,提高查询的速度,本质上就是在减少磁盘IO的次数。

最后,当前B+树结构,只是针对MySQL的InnoDB(最主流的一种存储引擎)这个数据引擎里面使用的数据结构。不同的数据库不同的存储引擎,里面的存储结构可能存在差异。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/87432.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

搭建Flutter Web开发调试环境

Setting up the Framework/Engine development environment背景搭建 framework 开发环境修改调试 framework 源码运行 framework 测试用例同步更新 framework 源码搭建 engine 开发环境准备 depot_tools部署 engine 源码编译 engine 源码修改调试 engine 源码指定 --local-engi…

​极氪汽车被曝拟美股上市:最高募资10亿 李书福接连收获IPO

雷递网 雷建平 12月13日极氪汽车日前被曝出已“秘密递交申请”,准备在美股上市,此次拟募资10亿美元,估值可能高达100亿美元。有分析认为,极氪汽车秘密递交招股书,是为尽可能向其他竞争对手隐藏招股书细节,以…

十二、对象继承深入、call_apply、※圣杯模式、※构造函数和闭包、※企业模块化

十二、对象继承深入、call_apply、※圣杯模式、※构造函数和闭包、※企业模块化 对象继承深入 原型链继承 原型链定义 ​ 对象沿着__proto__在原型上寻找属性形成一种链条式的继承关系,这种继承关系就叫做原型链。 例如: Professor.prototype {na…

Linux(二)vim编辑器,gcc,库

vim 简介 vi是“visual interface”的简称。 类似于Windows下的记事本。 vim可以视为vi的高级版本 按下vimtutor进入帮助文档,以下内容在其中都有 vim的三种模式 Vi有三种基本工作模式:命令模式、文本输入模式、末行模式 基本操作 命令模式下的操作…

迷宫--dfs解法以及迷宫问题要不要回溯

文章目录题意题解思路:问题: 迷宫问题dfs要不要回溯?题意 一天Extense在森林里探险的时候不小心走入了一个迷宫,迷宫可以看成是由 n∗n 的格点组成,每个格点只有2种状态,.和#,前者表示可以通行…

装载问题 ——分支限界法(Java)

装载问题 ——分支限界法(Java) 文章目录装载问题 ——分支限界法(Java)1、 问题描述2、算法设计3、算法的改进4、程序代码5、参考资料1、 问题描述 有一批共n个集装箱要装上2艘载重量分别为C1和C2的轮船,其中集 装箱…

数图互通高校房产管理——教职工住宅方案

数图互通房产管理系统在这方面做得比较全面; 1、住房管理 1.1 住房档案 住房模块的管理主要是针对学校的承租住宅和已售住宅的管理,用于登记已售住宅的产权人信息,记录承租住宅的租赁起止日期、月租金等基本信息。 支持住房的坐落信息、楼栋…

Cas:146368-11-8(水溶)|Sulfo CY5-羧酸|Cyanine5 Carboxylic Acidic acid

Cas:146368-11-8(水溶)|Sulfo CY5-羧酸|Cyanine5 Carboxylic Acidic acid Sulfo CY5-羧酸这种分子可以被认为是非活性染料,用于控制样品和仪器校准。为了与胺和蛋白质标记偶联, 中文名:Sulfo CY5-羧酸 英文名:Cyanine5 Carboxy…

rate-limit 一款 java 开源渐进式分布式限流框架使用介绍

项目简介 rate-limit 是一个为 java 设计的渐进式限流工具。 目的是为了深入学习和使用限流,后续将会持续迭代。 特性 渐进式实现 支持独立于 spring 使用 支持整合 spring 支持整合 spring-boot 内置多种限流策略 快速开始 需求 jdk 1.7 maven 3.x mav…

ARM S5PV210 时钟系统与时钟体系框图

前言 This chapter describes the clock management unit (CMU) supported by S5PV210. The system controller (SYSCON) manages CMU and power management unit (PMU) in S5PV210. 本章介绍 S5PV210 支持的时钟管理单元(CMU)。系统控制器&#xff08…

【软考】系统集成项目管理工程师(十一)项目人力资源管理

一、项目人力资源管理概述二、激励理论1. 马斯洛需求层次理论2. 赫茨伯格的双因素理论3. X 理论/ Y 理论4. 期望理论三、人力资源管理子过程1. 规划人力资源管理2. 组建项目团队3. 建设项目团队4. 管理项目团队一、项目人力资源管理概述 在了解人力资源管理之前,我们先来认识…

从局部到全局:语义相似度的测地线距离

©PaperWeekly 原创 作者 | 苏剑林单位 | 追一科技研究方向 | NLP、神经网络前段时间在最近的一篇论文《Unsupervised Opinion Summarization Using Approximate Geodesics》[1] 中学到了一个新的概念,叫做“测地线距离(Geodesic Distance&#xff…

.net开发安卓入门 - Service (服务)

.net开发安卓入门 - Service Android Service 概述Service VS Thread (服务和线程之间进行选择)前台服务代码启动前台服务方法运行效果后台服务代码启动代码绑定服务AIDL同系列文章推荐Android Service 概述 移动应用不像桌面应用。 桌面具有大量资源&a…

基于51单片机的正弦波发生器设计

程序运行图&#xff1a; 仿真原理图&#xff1a; 部分程序&#xff1a; #include <reg52.h> //接口定义 sbit DA P1^1; sbit CK P1^2; sbit CS P1^4; //10bit取样&#xff0c;1024点正弦查表数据 unsigned int code sine_dot[1024] { 0x200,0x203,0x206,0x209,…

可视化编排的数据集成和分发开源框架Nifi轻松入门-上

文章目录概述定义dataflow面临挑战特性核心概念架构高级概述安装部署常见处理器入门示例概述 定义 Nifi 官网地址 https://nifi.apache.org/ Nifi 官网文档 https://nifi.apache.org/docs.html Nifi GitHub源码地址 https://github.com/apache/nifi Apache NiFi是一个易于使用…

NetInside助力IT提高业务性能管理能力(二)

​​需求简介 某外高桥公司的OA系统是其重要的业务系统&#xff0c;OA系统负责人表示&#xff0c;部分用户反馈&#xff0c;访问OA系统时比较慢。需要通过分析系统看一下实际情况。 本次分析重点针对OA系统性能进行分析&#xff0c;以供安全取证、性能分析、网络质量监测以及…

关于推特隐私设置的一些小窍门

大家在使用推特进行引流的时候&#xff0c;在使用的时候难免会遇到一些功能模糊不清&#xff0c;这里twitter群推王给大家总结了一些偏门功能应该如何去设置&#xff0c;让你使用起来更加得心应手。 一、推特怎么设置自动放声音 1、首先打开推特APP并登陆。 2、其次在推特主…

CPDA认证|数据分析能给企业带来哪些好处?

数据分析的核心并不在于数据本身&#xff0c;而在于设计有意义、有价值的数据分析主题与指标体系&#xff0c;通过科学有效的手段去分析&#xff0c;进而发现问题优化迭代。 无论分析给出的结果是积极的还是负面的&#xff0c;都是价值承载体&#xff0c;必须以客观的态度面对。…

Enum枚举

枚举一般是针对常量需求,优化代码,.使代码看起来简洁 看下下面这个工具类 说有问题,那就是是看起来代码不够简洁 我看着倒还行,也许也是枚举不怎么实用的原因 下面就用枚举来优化这个代码,首先看下枚举介绍 java中对常量数据的配置可以使用枚举类型实现,,枚举类型是面向对象…

3小时!开发ChatGPT微信小程序

导读 | 上周OpenAI发布了对话语言模型 ChatGPT&#xff0c;相关讨论引爆全网。你是否也迫不及待体验一番&#xff1f;本文特邀作者腾讯云开发者社区作者戴传友从开发环境准备、开发过程、服务器接口、腾讯API网关接入到部署&#xff0c;详细教你如何动手开发一个chatGPT微信小程…