谈数据库查询涉及的存储效率

news2025/7/17 22:32:05

(Owed by: 春夜喜雨 http://blog.csdn.net/chunyexiyu)
参考:https://blog.csdn.net/Sword52888/article/details/125352635

11月马上也进入尾声了;紧接着的12月,新年也就不远了…

今年对数据查询做了许多的分析、测试、修改、验证,慢慢进入了一个瓶颈期。或许是大的优化,好做的优化都已经实施了,下来都是比较难啃的硬骨头了。

下面就遇到的瓶颈点,与用过的或未曾用过的方式,大概记录记录。
注:想到什么写什么了,后面再慢慢修改补充。

查询优化与存储

对于数据查询来说,主要的瓶颈就在存储IO,磁盘IO的读写速度低于内存处理、CPU处理数个数量级。是查询效率优化的中心,优化也都于围绕着它展开。

下面图片来源于https://blog.csdn.net/Sword52888/article/details/125352635

在这里插入图片描述

减少不必要的IO

如何保留必要的磁盘IO,减少不必要的磁盘IO是一个比较关键的事情。
数据库中的元素通常按照block块存储,减少不必要block块或非目标块的读取就是一个比较重要的点。
例如设计比较好的索引归类方式,或bloomfilter过滤,也或其它filter方式,来减少无效的block读取,减少IO次数。

减少非连续IO

另外基于业务查询特点,查询之间可能存在天然的联系,例如查询账单,这一小时和下一小时的账单通常会被一起查询,那么如果他们在一个block中,或者相邻存储,则磁盘效率会比较高。

Cache的使用

一样的参考存储的效率差异,内存相对于磁盘,取数据要高很多。
从磁盘读取block块数据时,不要用完即扔,而是用完存储到内存Cache中,下次查询或许就用得到block中的其它数据,也或下次还会查该信息。

cache的使用,也用于减少了磁盘的IO次数,cache命中的次数越多,磁盘io的次数就相应的减少越多。

但cache也不能无限的增长,否则内存就不够用了,全cache到内存中,数据少还可以,如果上百GB以上的数据,无论如何不是很可行的。

如何优化Cache的淘汰方式,优化既要限定Cache大小,并要能够一定程度的保障Cache命中率又足够优秀,就是一个需要权衡的事情。典型的既要又要,常用的LRU算法算一种,像innodb改进型的LRU(区分yong与old区域)也是都在争取既要又要。

Buffer的使用

Buffer的使用也勉强算一个点,写buffer缓存的部分数据,是最近新写入的数据。

这部分数据,在某些业务中或许也是使用比较频繁的数据。

Buffer一方面解决写内存速度与写磁盘IO速度不一致的情况,另外足够大的写Buffer,也能为最新写入数据查询提供一定的便利,如果数据查到在写buffer中,则也减少了向Cache或磁盘IO发起查询。

Cache的细分

再进一步,Cache细分:
有Block-Cache,有查询结果Result-Cache,有压缩Cache与非压缩Cache,有全局Cache与局部细分Cache。

不同的Cache种类,适用场景也不尽相同:
Block-Cache属于块Cache,不关心内容;Result-Cache是查询结果Cache,和用户查询动作相关;Block-Cache适用于预测,block内其它内容也可能被使用,也适用结果查了再查;Result-Cache适用于预测,查询会查了再查的情况;另外result- cache单条查询结果通常比block要小很多。
有压缩的Cache与非压缩的Cache,两者差异是有无采用压缩,压缩的话可以在同样大小cache下增加存储的有效数据数量,相当于cpu时间换空间的效果,适用于希望限定cache大小规模缓存更多内容的情况。
全局Cache与局部Cache,就是分级Cache了,平衡业务特点,是把局部cache做大一些,还是全局cache做大一些。

局部性原理应用

我们知道局部性原理会提升cpu的处理效率,局部性原理好的程序代码,同样的任务执行时间更短,效率更高。对于计算密集型的如此,对于io密集型的更加显著。
局部性原理起作用应该就是register各级cache换入换成造成的时间消耗差异。
对于io密集型程序,涉及的mem大小更大,也更频繁,对于局部性原理也就更加明显了。
程序优化时,适当的考虑局部性原理,会对查询效率带来帮助。

总而言之

总而言之,对于查询涉及的存储效率:
一方面减少磁盘IO的次数,一方面减少非连续IO的次数,对查询性能是很有帮助的,这块cache引入也是为此服务;另外考虑局部性原理,尽量操作相近的内存,也对查询有帮助。

(Owed by: 春夜喜雨 http://blog.csdn.net/chunyexiyu)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/38609.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

centOS 7 Install Harbor(私有镜像仓库)V2

一、安装docker环境 略. 二、下载离线安装包 下载地址https://github.com/goharbor/harbor/releases/download/v1.10.15/harbor-offline-installer-v1.10.15.tgz三、拷贝到服务器/application #解压 tar -xvf harbor-online-installer-v1.2.0.tgz #生成证书 cd /applicati…

【计算机毕业设计】45.医院挂号系统

一、系统截图(需要演示视频可以私聊) 摘 要 伴随着社会以及科学技术的发展,互联网已经渗透在人们的身边,网络慢慢的变成了人们的生活必不可少的一部分,紧接着网络飞速的发展,管理系统这一名词已不陌生&…

【计算机毕业设计】41.航空订票系统

摘 要 网络的广泛应用给生活带来了十分的便利。所以把航空订票与现在网络相结合,利用JSP技术建设航空订票系统,实现航空订票的信息化。则对于进一步提高航班公司的发展,丰富航空订票经验能起到不少的促进作用。 航空订票系统能够通过互联网…

数字信号处理-10-并行FIR滤波器MATLAB与FPGA实现

前言 本文介绍了设计滤波器的FPGA实现步骤,并结合杜勇老师的书籍中的并行FIR滤波器部分进行一步步实现硬件设计,对书中的架构做了复现以及解读,并进行了仿真验证。 并行FIR滤波器FPGA实现 FIR滤波器的结构形式时,介绍了直接型、…

23. [Python GUI] PyQt5中的模型与视图框架-抽象视图基类QAbstractItemView

PyQt5的抽象视图基类QAbstractItemView 一、QAbstractItemView的基本概念 QAbstractItemView 类继承自 QAbstractScrollArea,后者又继承自 QFrame,该类是 Qt 所有视图类的基类, Qt 的所有视图都需要子类化该类。注意:该类是抽象…

Linux系统编程(四)——signal信号处理

目录 0x01 信号 0x02 信号相关的函数 一、kill函数 二、alarm()函数 三、setitimer() 四、signal() 0x03 信号集 一、信号集的处理过程 ​编辑 二、关于信号集处理的函数 0x04 内核实现信号捕捉的过程 0x05 SIGCHLD信号 0x01 信号 信号是Linux进程间通信的最古老的…

通过FNN算法进行特征组合的商品推荐详细教程 有代码+数据

案例知识点 推荐系统任务描述:通过用户的历史行为(比如浏览记录、购买记录等等)准确的预测出用户未来的行为;好的推荐系统不仅如此,而且能够拓展用户的视野,帮助他们发现可能感兴趣的却不容易发现的item;同时将埋没在长尾中的好商品推荐给可能感兴趣的用户。CTR表示Clic…

【2021 MCM】 Problem A: Fungi by 2100454

【2021 MCM】 Problem A: Fungi by 2100454 文章目录【2021 MCM】 Problem A: Fungi by 2100454一、题目分析1.1 问题总述1.2 具体任务1.3 需要提交的内容二、论文解读2.1 摘要2.2 目录2.3 简介2.4 假设2.5 缩写和定义2.6 The GAME Model2.6.1 Gause’s Model for Predicting F…

防火墙基本概念

防火墙是一款具有安全防护功能的网络设备,保护一个网络区域避免另一个网络区域的攻击和入侵。 物理防火墙(物理设备)、软件防火墙(Windows自带firewall) 其本职工作是隔离网络 基本功能 会话管理内网安全管控入侵…

[附源码]java毕业设计中医药系统论文2022

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

痞子衡嵌入式:MCUXpresso IDE下高度灵活的FreeMarker链接文件模板机制

大家好,我是痞子衡,是正经搞技术的痞子。今天痞子衡给大家分享的是MCUXpresso IDE下高度灵活的FreeMarker链接文件模板机制。 痞子衡之前写过一篇文章 《MCUXpresso IDE下工程链接文件配置管理与自动生成机制》,这篇文章介绍了 MCUXpresso ID…

网页前端知识汇总(三)——网页前端利用二维码插件qrcode生成在线二维码

最近几年二维码的广泛应用,方便了很多行业,如支付宝,微信,小程序扫码之类的,这个在二十年前,想都不敢想这么方便,那时候有书刊编码扫一扫都感觉是高科技了,如今,二维码的…

RNA-seq 详细教程:实验设计(2)

学习目标 了解设置重复对于 RNA-seq 分析的重要性了解生物重复次数、测序深度和鉴定到的差异表达基因之间的关系了解如何设计RNA-seq 实验,以避免批次效应1. 注意事项 了解 RNA 提取和 RNA-seq 文库制备实验过程中的步骤,有助于设计 RNA-seq 实验&#x…

PyTorch学习笔记-常用函数与数据加载

1. PyTorch常用函数 (1)路径相关的函数 假设我们数据集的目录结构如下: 首先需要 import os,在 os 中常用的路径相关的函数有: os.listdir(path):将 path 目录下的内容列成一个 list。os.path.join(path1…

cmake入门教程 跨平台项目构建工具cmake介绍

一.初识cmake 在介绍cmake之前,我们先来从工具一个个衍生出来,做过linux c/c编程的时候一般用过gcc指令或者makefile。我们先来介绍下 gcc(GNU Compiler Collection)将源文件编译(Compile)成可执行文件或…

若依框架解读(前后端分离版)—— 1.Spring Security相关配置(@Anonymous注解)

有关Spring Security与JWT相关知识可以看我之前写的文章:SpringBoot整合SpringSecurityJWT(三更草堂) 这边需要对RBAC模型有一点了解,比较简单可自行百度。 首先查看Security配置类SecurityConfig,如果我们想要放行自己写的接口是可以在此配置…

数学建模国赛/美赛常见赛题类型及建模方案(纯干货)

目录 一,评价类问题 1,建模步骤如下图所示: 2,主客观评价问题的区别 3,如何选择合适的评价方法 二,预测类赛题 1,预测类赛题的基本解题步骤 2,预测类问题的区别 3,…

什么是Tomcat?如何使用Tomcat?如何部署一个静态页面?

目录 1、Tomcat是什么? 2、下载安装 3、目录结构 4、启动服务器 5、部署静态页面(简单举例) 1、Tomcat是什么? Tomcat是一个HTTP服务器,Tomcat就是基于Java实现的一个开源免费的HTTP服务器 2、下载安装 下载网…

virtualbox安装openEuler-方案二

下载的讲解在另一篇:VirtualBox安装openEuler 方案一 安装: 1,配置网卡 2,加载光驱设置 选择对应的iso文件即可。 3,启动openEuler 选择第一个即可,第二个选项一般是在生成环境中使用。 经过一段…

std::weak_ptr(分析、仿写)

目录 一、为什么会有weak_ptr? 1、看一个例子 2.weak_ptr 是什么? 3.weak_ ptr 如何使用? 1、如何创建weak_ ptr 实例 2、如何判断weak_ptr指向的对象是否存在 3、weak_ptr的使用 二、仿写std::weak_ptr 1、c参考手册 2、代码 一、为什么会有weak_ptr? 1、看一个例子…