Go分布式缓存 一致性哈希(hash)(day4)

news2025/7/12 20:34:25

Go分布式缓存 一致性哈希(hash)(day4)

1 为什么使用一致性哈希

今天我们要实现的是一致性哈希算法,一致性哈希算法是 GeeCache 从单节点走向分布式节点的一个重要的环节。那你可能要问了,

童鞋,一致性哈希算法是啥?为什么要使用一致性哈希算法?这和分布式有什么关系?

1.1 我该访问谁?

对于分布式缓存来说,当一个节点接收到请求,如果该节点并没有存储缓存值,那么它面临的难题是,从谁那获取数据?自己,还是节点1, 2, 3, 4… 。假设包括自己在内一共有 10 个节点,当一个节点接收到请求时,随机选择一个节点,由该节点从数据源获取数据。

假设第一次随机选取了节点 1 ,节点 1 从数据源获取到数据的同时缓存该数据;那第二次,只有 1/10 的可能性再次选择节点 1, 有 9/10 的概率选择了其他节点,如果选择了其他节点,就意味着需要再一次从数据源获取数据,一般来说,这个操作是很耗时的。这样做,一是缓存效率低,二是各个节点上存储着相同的数据,浪费了大量的存储空间。

那有什么办法,对于给定的 key,每一次都选择同一个节点呢?使用 hash 算法也能够做到这一点。那把 key 的每一个字符的 ASCII 码加起来,再除以 10 取余数可以吗?当然可以,这可以认为是自定义的 hash 算法。

hash select peer

从上面的图可以看到,任意一个节点任意时刻请求查找键 Tom 对应的值,都会分配给节点 2,有效地解决了上述的问题。

1.2 节点数量变化了怎么办?

简单求取 Hash 值解决了缓存性能的问题,但是没有考虑节点数量变化的场景。假设,移除了其中一台节点,只剩下 9 个,那么之前 hash(key) % 10 变成了 hash(key) % 9,也就意味着几乎缓存值对应的节点都发生了改变。即几乎所有的缓存值都失效了。节点在接收到对应的请求时,均需要重新去数据源获取数据,容易引起 缓存雪崩

缓存雪崩:缓存在同一时刻全部失效,造成瞬时DB请求量大、压力骤增,引起雪崩。常因为缓存服务器宕机,或缓存设置了相同的过期时间引起。

那如何解决这个问题呢?一致性哈希算法可以。

2 算法原理

2.1 步骤

一致性哈希算法将 key 映射到 2^32 的空间中,将这个数字首尾相连,形成一个环。

  • 计算节点/机器(通常使用节点的名称、编号和 IP 地址)的哈希值,放置在环上。
  • 计算 key 的哈希值,放置在环上,顺时针寻找到的第一个节点,就是应选取的节点/机器。

一致性哈希添加节点 consistent hashing add peer

环上有 peer2,peer4,peer6 三个节点,key11key2key27 均映射到 peer2,key23 映射到 peer4。此时,如果新增节点/机器 peer8,假设它新增位置如图所示,那么只有 key27 从 peer2 调整到 peer8,其余的映射均没有发生改变。

也就是说,一致性哈希算法,在新增/删除节点时,只需要重新定位该节点附近的一小部分数据,而不需要重新定位所有的节点,这就解决了上述的问题。

2.2 数据倾斜问题

如果服务器的节点过少,容易引起 key 的倾斜。例如上面例子中的 peer2,peer4,peer6 分布在环的上半部分,下半部分是空的。那么映射到环下半部分的 key 都会被分配给 peer2,key 过度向 peer2 倾斜,缓存节点间负载不均。

为了解决这个问题,引入了虚拟节点的概念,一个真实节点对应多个虚拟节点。

假设 1 个真实节点对应 3 个虚拟节点,那么 peer1 对应的虚拟节点是 peer1-1、 peer1-2、 peer1-3(通常以添加编号的方式实现),其余节点也以相同的方式操作。

  • 第一步,计算虚拟节点的 Hash 值,放置在环上。
  • 第二步,计算 key 的 Hash 值,在环上顺时针寻找到应选取的虚拟节点,例如是 peer2-1,那么就对应真实节点 peer2。

虚拟节点扩充了节点的数量,解决了节点较少的情况下数据容易倾斜的问题。而且代价非常小,只需要增加一个字典(map)维护真实节点与虚拟节点的映射关系即可。

3 Go语言实现

我们在 geecache 目录下新建 package consistenthash,用来实现一致性哈希算法。

day4-consistent-hash/geecache/consistenthash/consistenthash.go

package consistenthash

import (
	"hash/crc32"
	"sort"
	"strconv"
)

// Hash maps bytes to uint32
type Hash func(data []byte) uint32

// Map constains all hashed keys
type Map struct {
	hash     Hash
	replicas int
	keys     []int // Sorted
	hashMap  map[int]string
}

// New creates a Map instance
func New(replicas int, fn Hash) *Map {
	m := &Map{
		replicas: replicas,
		hash:     fn,
		hashMap:  make(map[int]string),
	}
	if m.hash == nil {
		m.hash = crc32.ChecksumIEEE
	}
	return m
}
  • 定义了函数类型 Hash,采取依赖注入的方式,允许用于替换成自定义的 Hash 函数,也方便测试时替换,默认为 crc32.ChecksumIEEE 算法。
  • Map 是一致性哈希算法的主数据结构,包含 4 个成员变量:Hash 函数 hash;虚拟节点倍数 replicas;哈希环 keys;虚拟节点与真实节点的映射表 hashMap,键是虚拟节点的哈希值,值是真实节点的名称。
  • 构造函数 New() 允许自定义虚拟节点倍数和 Hash 函数。

接下来,实现添加真实节点/机器的 Add() 方法。

// Add adds some keys to the hash.
func (m *Map) Add(keys ...string) {
	for _, key := range keys {
		for i := 0; i < m.replicas; i++ {
			hash := int(m.hash([]byte(strconv.Itoa(i) + key)))
			m.keys = append(m.keys, hash)
			m.hashMap[hash] = key
		}
	}
	sort.Ints(m.keys)
}
  • Add 函数允许传入 0 或 多个真实节点的名称。
  • 对每一个真实节点 key,对应创建 m.replicas 个虚拟节点,虚拟节点的名称是:strconv.Itoa(i) + key,即通过添加编号的方式区分不同虚拟节点。
  • 使用 m.hash() 计算虚拟节点的哈希值,使用 append(m.keys, hash) 添加到环上。
  • hashMap 中增加虚拟节点和真实节点的映射关系。
  • 最后一步,环上的哈希值排序。

最后一步,实现选择节点的 Get() 方法。

// Get gets the closest item in the hash to the provided key.
func (m *Map) Get(key string) string {
	if len(m.keys) == 0 {
		return ""
	}

	hash := int(m.hash([]byte(key)))
	// Binary search for appropriate replica.
	idx := sort.Search(len(m.keys), func(i int) bool {
		return m.keys[i] >= hash
	})

	return m.hashMap[m.keys[idx%len(m.keys)]]
}
  • 选择节点就非常简单了,第一步,计算 key 的哈希值。
  • 第二步,顺时针找到第一个匹配的虚拟节点的下标 idx,从 m.keys 中获取到对应的哈希值。如果 idx == len(m.keys),说明应选择 m.keys[0],因为 m.keys 是一个环状结构,所以用取余数的方式来处理这种情况。
  • 第三步,通过 hashMap 映射得到真实的节点。

至此,整个一致性哈希算法就实现完成了。

4 测试

最后呢,需要测试用例来验证我们的实现是否有问题。

day4-consistent-hash/geecache/consistenthash/consistenthash_test.go

package consistenthash

import (
	"strconv"
	"testing"
)

func TestHashing(t *testing.T) {
	hash := New(3, func(key []byte) uint32 {
		i, _ := strconv.Atoi(string(key))
		return uint32(i)
	})

	// Given the above hash function, this will give replicas with "hashes":
	// 2, 4, 6, 12, 14, 16, 22, 24, 26
	hash.Add("6", "4", "2")

	testCases := map[string]string{
		"2":  "2",
		"11": "2",
		"23": "4",
		"27": "2",
	}

	for k, v := range testCases {
		if hash.Get(k) != v {
			t.Errorf("Asking for %s, should have yielded %s", k, v)
		}
	}

	// Adds 8, 18, 28
	hash.Add("8")

	// 27 should now map to 8.
	testCases["27"] = "8"

	for k, v := range testCases {
		if hash.Get(k) != v {
			t.Errorf("Asking for %s, should have yielded %s", k, v)
		}
	}

}

如果要进行测试,那么我们需要明确地知道每一个传入的 key 的哈希值,那使用默认的 crc32.ChecksumIEEE 算法显然达不到目的。所以在这里使用了自定义的 Hash 算法。自定义的 Hash 算法只处理数字,传入字符串表示的数字,返回对应的数字即可。

  • 一开始,有 2/4/6 三个真实节点,对应的虚拟节点的哈希值是 02/12/22、04/14/24、06/16/26。
  • 那么用例 2/11/23/27 选择的虚拟节点分别是 02/12/24/02,也就是真实节点 2/2/4/2。
  • 添加一个真实节点 8,对应虚拟节点的哈希值是 08/18/28,此时,用例 27 对应的虚拟节点从 02 变更为 28,即真实节点 8。

5.总结

通过一致性哈希算法解决 缓存失效时效率较低和缓存雪崩问题。

通过增加虚拟结点,一个真实结点映射多个虚拟结点,保证缓存负载均衡。

扩展了节点的数量,代价较小。

查找的话就是二分在环上找到第一个大于等于该结点hash值的虚拟结点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/8628.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于几何约束的传动机构设计

本文介绍如何使用参数化 CAD 软件中几何约束的强大功能来加速机构的开发。 许多 CAD 程序提供了用于分析和改进机制的工具。但是&#xff0c;这些假设你已经有了初始设计。合成机构的经典图形方法提供了确定连杆长度和关节位置以产生特定运动的方法。 这些方法可以使用参数化…

工作这么久了,还不懂多线程吗?

浩哥Java多线程整理学习系列之01 基础知识整理 浩哥Java多线程整理学习系列之01基础知识整理1. 如何查看电脑核数及线程数Linux查询CPU核心数2. 线程和进程、协程之间的区别3. 时间片轮转&#xff08;RR&#xff09;调度算法4. 并行和并发的区别5. 系统限制线程数6. 并发的优缺…

[go学习笔记.第十四章.协程和管道] 1.协程的引入,调度模型以及运行cpu数目,协程资源竞争问题

1.先看一个需求 需求&#xff1a; 要求统计 1~9000000000 的数字中&#xff0c;哪些是素数&#xff1f; 分析思路&#xff1a; (1).传统的方法&#xff0c;就是使用一个循环&#xff0c;循环的判断各个数是不是素数.(很慢) (2).使用并发或者并行的方式&#xff0c;将统计素数的…

CEX暴雷怎么办 一文读懂加密钱包产业现状

你的钱其实并不在你的借记卡里&#xff0c;借记卡只是授权你的银行帐户向银行系统数据库发送交易。同样&#xff0c;你的代币也并不在你的加密钱包里。加密钱包只是持有私有密钥以证明对数字资产的所有权&#xff0c;而这些资产是存储在公共区块链网络上的。私钥能让你对加密钱…

详细介绍BERT模型

文章目录BERT简介BERT, OpenAI GPT, 和ELMo之间的区别相关工作BERT的改进BERT 的详细实现输入/输出表示预训练BERT微调BERTBERT用在下游任务GLUE(一个自然语言任务集合)SQuAD v1.1(QA数据集)SQuAD v2.0SWAG消融实验预训练任务的影响模型大小的影响基于特征的BERT方法结论BERT简…

js对象和原型、原型链的关系

JS的原型、原型链一直是比较难理解的内容&#xff0c;不少初学者甚至有一定经验的老鸟都不一定能完全说清楚&#xff0c;更多的"很可能"是一知半解&#xff0c;而这部分内容又是JS的核心内容&#xff0c;想要技术进阶的话肯定不能对这个概念一知半解&#xff0c;碰到…

[附源码]计算机毕业设计JAVA大学生足球预约信息

[附源码]计算机毕业设计JAVA大学生足球预约信息 项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM myba…

【JavaWeb】HTML学习完整篇

推荐学习专栏&#xff1a;JavaWeb学习专栏 目录1、HTML 语法规范&#xff08;1&#xff09;基本语法概述&#xff08;2&#xff09;标签关系2、HTML 基本结构标签3、 网页开发工具&#xff08;1&#xff09;使用方法&#xff08;2&#xff09;VSCode 工具生成骨架标签新增代码&…

Java项目——物业管理系统(附源码+数据库)

今天给小伙伴们分享一个Java项目——物业管理系统&#xff08;附源码数据库&#xff09; 感兴趣的小伙伴可以点击下方链接和小编一起学习哟~ https://www.bilibili.com/video/BV1cD4y1s73E/?spm_id_from333.999.0.0&vd_sourcea7816e3b2a3a67ac39dc87f6bf92421chttps://w…

下载和安装vscode教程和配置中文插件(超详细)

前言&#xff1a; vscode主要是用于前端的编程工具&#xff0c;其他编程的语言也可以在vscode里面编程运行。 优点&#xff1a;简洁、占用内存小、界面美观 一、下载步骤 1.到官网根据自己的操作系统进行下载&#xff08;这是超链接&#xff09;&#xff0c;直接点击下载。…

数据库导入现有的mysql文件和_列的别名_和_去重

一、数据导入指令&#xff1a;source 类的全路径 在命令行客户端登录mysql&#xff0c;使用 source 指令导入 mysql> source d:\mysqldb.sql二、列的别名 重命名一个列便于计算紧跟列名&#xff0c;也可以在列名和别名之间加入关键字AS&#xff0c;别名使用双引号&#x…

3款windows实用软件,免费又良心,真正懂你的需求

闲话少说&#xff0c;干货奉上。 1、RevoUninstaller 一不小心安装了流氓捆绑软件&#xff0c;某安全卫士那它并没有办法&#xff0c;RevoUninstaller这款小白也能使用的卸载工具&#xff0c;支持免费使用&#xff0c;让流氓软件无所遁形。它有一个非常强大的猎人模式功能&…

计算机毕业设计——农产品资源展示平台

一.项目介绍 本项目包含管理员、商家和 用户三种角色 管理员角色包含以下功能&#xff1a; 登录、个人中心、用户管理、商家管理、最新农产品管理、农产品资源管理、特色农产品管理、在售农产品管理、招商合作管理、关于我们、帮助中心、收藏管理、留言管理、系统管理、…

码神之路项目总结(三)

目录 一、评论列表 二、评论 三、发布文章--所有文章分类 四、发布文章--所有文章标签 五、发布文章 六、AOP记录日志 一、评论列表 请求接口&#xff1a; 数据库表结构解析&#xff1a; 思路&#xff1a; 1、首先接收前端的文章id&#xff0c;通过文章id和level1查出第一层评…

SpringBootApplication注解

注解的使用 SpringBootApplication 符合注解&#xff1a;由 SpringBootConfiguration EnableAutoConfiguration ComponentScan 1.SpringBootConfiguration Configuration public interface SpringBootConfiguration { AliasFor( annotation Confi…

spring cloud kubernetes 本地开发环境搭建

背景 在上文Spring Cloud Zookeeper 升级为Spring Cloud Kubernetes 之后&#xff0c;我们由于使用了Kubernetes的服务发现&#xff0c;由于本地不在Kubernetes中&#xff0c;导致本地项目启动失败。所以就只能把代码部署到Kubernetes中才能启动&#xff0c;那么就带来一个新问…

java基于springboot+vue的驾校报名预约管理系统 nodejs

网络的广泛应用给生活带来了十分的便利。所以把驾校报名管理与现在网络相结合&#xff0c;利用java技术建设驾校管理系统&#xff0c;实现驾校报名的信息化。则对于进一步提高驾校报名管理发展&#xff0c;丰富驾校报名管理经验能起到不少的促进作用。 驾校管理系统能够通过互联…

java后端返回给前端对象时去除值为空或NULL的属性

前言 测试接口时发现当返回的对象中属性值为 “” 或 [] 或 null 时&#xff0c;该属性依然会返回&#xff0c;这样数据看起来很不美观并且有时候也会导致前端组件出现一些小的bug。 例如这个下拉框&#xff0c;人事科下面是没有部门的&#xff0c;但是由于接口返回了 child…

数据分析er看过来,五款工具有你需要的

“我想转行做数据分析&#xff0c;但是我只会用Excel&#xff0c;不会其他的工具&#xff0c;有其他的数据分析工具推荐么&#xff1f;“ “我不会python&#xff0c;那我可以做数据分析吗” 大部分人对数据分析的的第一印象就是Excel&#xff0c;python&#xff0c;其实选择一…

Cy5.5 N-羟基琥珀酰亚胺酯,Cy5.5 nhs ester,CAS:1469277-96-0

产品名称&#xff1a;CY5.5琥珀酰亚胺脂&#xff0c;Cy5.5 N-羟基琥珀酰亚胺酯 英文名称&#xff1a;Cyanine5.5 NHS ester&#xff0c;Cyanine5.5 SE&#xff0c;CY5.5 NHS CAS:1469277-96-0 外观&#xff1a;蓝色至深蓝色固体 分子式&#xff1a;C45H48IN3O4 分子量&…