什么是哈希算法?(大白话+原理+应用,一次讲透)
文章目录一、一句话定义二、用生活例子秒懂对应到代码里三、哈希算法的核心特性面试必背四、为什么 HashSet.contains() 是 O(1)结合哈希原理五、哈希算法的常见应用你日常都在用1. 数据结构HashSet / HashMap你这道题的核心2. 密码存储互联网大厂核心应用3. 文件校验下载/传输必备4. 区块链/比特币六、哈希碰撞是什么怎么解决1. 哈希碰撞的定义2. 常见解决方法Java HashSet 用的就是这个1链地址法Java 8 之前2数组链表红黑树Java 8七、常见的哈希算法有哪些八、回到你的题目哈希算法的作用九、极简总结面试直接背我用最通俗、最不绕弯的方式从「是什么→怎么工作→为什么快→有什么用」给你讲清楚完全贴合你之前的HashSet场景。一、一句话定义哈希算法Hash Algorithm也叫散列算法是一种把任意长度的输入数据通过固定的计算规则转换成固定长度、唯一近似唯一的输出值的算法。输入任意长度的内容比如字符a、字符串abc、文件、图片等输出哈希值Hash Value也叫散列值通常是一串固定长度的数字/字符核心特点输入→输出是单向的、不可逆的且相同输入永远得到相同输出二、用生活例子秒懂你可以把哈希算法理解成一个**「超级智能快递柜分配系统」**快递柜 HashSet底层的哈希表快递 你要存的元素比如字符a、b哈希算法 分配规则根据快递的「收件人手机号」直接算出它应该放在哪个柜子里对应到代码里当你把字符a放进HashSet时HashSet调用哈希算法给a算一个唯一的哈希值比如97就是a的 ASCII 码用哈希值对数组长度取模直接算出a应该放在哈希表的第index个位置下次判断set.contains(a)时直接用同样的算法算出位置去对应柜子里找不用挨个翻所有柜子三、哈希算法的核心特性面试必背特性说明作用确定性相同输入 → 永远得到相同哈希值保证HashSet能精准定位元素单向性只能从输入算哈希值不能从哈希值反推输入密码存储、数据加密的核心雪崩效应输入哪怕只改1个比特哈希值会完全不同防篡改比如文件校验抗碰撞性不同输入 → 尽量得到不同哈希值理论上无法完全避免碰撞保证哈希表性能四、为什么HashSet.contains()是 O(1)结合哈希原理HashSet的底层是哈希表数组链表/红黑树它的contains()流程是对输入元素比如a调用哈希算法算出哈希值用哈希值对数组长度取模得到数组下标直接定位位置去对应下标位置检查是否有该元素整个过程不需要遍历整个集合只做1次哈希计算1次定位查找所以时间复杂度是O(1)平均情况。对比List.contains()List底层是数组没有哈希定位只能从下标0开始挨个遍历比较最坏情况要遍历所有元素所以时间复杂度是O(n)。五、哈希算法的常见应用你日常都在用1. 数据结构HashSet/HashMap你这道题的核心用哈希算法实现 O(1) 时间的增删改查是滑动窗口、缓存、去重等场景的核心数据结构你写的「无重复字符最长子串」就是靠HashSet的 O(1) 查找把暴力 O(n²) 优化成了 O(n)2. 密码存储互联网大厂核心应用网站不会存你的明文密码只会存密码的哈希值登录时把你输入的密码算哈希和数据库里的哈希值比对就算数据库泄露黑客也拿不到你的明文密码3. 文件校验下载/传输必备比如你下载一个系统镜像官网会给一个MD5/SHA256哈希值你下载完后给文件算哈希和官网比对就能确认文件有没有被篡改、有没有下载完整4. 区块链/比特币区块链的每个区块都包含前一个区块的哈希值一旦篡改某个区块哈希值就会变化后面所有区块都会失效保证数据不可篡改六、哈希碰撞是什么怎么解决1. 哈希碰撞的定义理论上输入是无限的哈希值是有限的所以一定会出现「不同输入算出相同哈希值」的情况这就是哈希碰撞。比如两个不同的字符算出了同一个哈希值被分配到了同一个柜子里。2. 常见解决方法JavaHashSet用的就是这个1链地址法Java 8 之前哈希表的每个数组位置都挂一个链表发生碰撞时把元素挂到对应位置的链表上查找时先定位数组位置再遍历链表找元素平均 O(1)最坏 O(n)2数组链表红黑树Java 8当链表长度超过阈值默认8自动把链表转成红黑树把链表的 O(n) 查找优化成红黑树的 O(logn)解决极端碰撞的性能问题七、常见的哈希算法有哪些算法输出长度特点应用场景MD5128位已被破解不推荐用于安全场景文件校验、旧系统SHA-1160位已被破解不推荐用于安全场景Git 版本控制SHA-256256位安全、抗碰撞性强区块链、密码存储、HTTPSCRC3232位计算快、校验效率高网络传输、文件校验八、回到你的题目哈希算法的作用你写的「无重复字符最长子串」用HashSet而不是List本质就是利用哈希算法的 O(1) 定位能力把算法的时间复杂度从 O(n²) 降到了 O(n)这是滑动窗口题型的核心优化思路。九、极简总结面试直接背哈希算法是一种将任意输入转换为固定长度哈希值的算法核心特性是确定性、单向性、抗碰撞性。HashSet基于哈希表实现通过哈希算法直接定位元素位置实现 O(1) 时间的contains()操作而List只能遍历查找时间复杂度 O(n)因此滑动窗口必须用Set/Map而非List。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2472365.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!