为什么 ArrayList 和 LinkedList 是线程不安全的?
在 Java 并发编程中ArrayList和LinkedList都是“臭名昭著”的线程不安全者。它们的线程安全性问题根源都在于内部状态如元素数组、大小、节点链接的修改操作并非原子性且缺乏同步机制。当多条线程同时修改同一个实例时就会产生数据污染、元素丢失等诡异问题。下面我们分别剖析它们的不安全根源。一、ArrayList 的线程不安全之源ArrayList 的底层是一个动态数组elementData和一个整型变量size来记录元素个数。它的不安全主要体现在三个方面1. 核心操作缺乏原子性以add(E e)方法为例一个简单的add方法在代码层面可能只是一行但在 JVM 执行时却分解为多个步骤public boolean add(E e) { modCount; // 步骤1修改次数加1用于迭代器快速失败 add(e, elementData, size); // 步骤2调用私有重载方法执行添加 return true; } private void add(E e, Object[] elementData, int s) { if (s elementData.length) { // 步骤3检查是否需要扩容 elementData grow(); // 步骤4扩容返回新数组 } elementData[s] e; // 步骤5在索引 s 处放入元素 size s 1; // 步骤6更新 size }从这段真实代码可以看出一个简单的add操作被分解为多个步骤并且这些步骤在并发执行时并非原子操作。多线程风险演示场景线程A和线程B同时执行add此时size 5且elementData.length 5无需扩容。可能的时间片轮转1. 线程A执行完步骤5elementData[5] a但还没来得及执行步骤6更新sizeCPU切换到了线程B。2. 线程B开始执行add它读取到的size仍然是5。于是它也执行步骤5将elementData[5] b将线程A刚刚放入的元素a覆盖了。3. 接着线程B执行步骤6将size更新为6。4. 之后线程A继续执行步骤6又将size更新为7基于它之前保存的s5计算s1。结果最终size为7但elementData[5]位置实际存放的是ba已丢失且elementData[6]位置是null。这就是典型的元素覆盖和索引错乱。2. 扩容机制引发的并发异常当add操作触发扩容时风险进一步加剧。上面的代码中grow()方法负责扩容// ArrayList 的扩容核心 private Object[] grow(int minCapacity) { // 获取当前数组的容量 int oldCapacity elementData.length; // 判断是否已经初始化过 if (oldCapacity 0 || elementData ! DEFAULTCAPACITY_EMPTY_ELEMENTDATA) { // 情况 1: 数组已经有容量或是已初始化的空数组 // 计算新的容量使用 ArraysSupport.newLength 方法 // 参数说明: // - oldCapacity: 旧容量 // - minCapacity - oldCapacity: 最小需要增长的容量必需增长 // - oldCapacity 1: 首选增长量右移 1 位相当于除以 2即增长 50% int newCapacity ArraysSupport.newLength(oldCapacity, minCapacity - oldCapacity, oldCapacity 1); // 复制原数组到新容量的数组并更新引用 return elementData Arrays.copyOf(elementData, newCapacity); } else { // 情况 2: 默认空数组首次扩容 // 取默认容量 (通常是 10) 和最小需要容量的较大值 return elementData new Object[Math.max(DEFAULT_CAPACITY, minCapacity)]; } }风险假设线程A和线程B同时检测到需要扩容即s elementData.length。它们都会进入grow()方法。线程A先执行Arrays.copyOf创建了一个新数组并将elementData指向它。紧接着线程B也执行Arrays.copyOf但此时它引用的elementData仍然是旧的数组因为线程A的赋值可能还没被线程B看到或者线程B已经读到了旧数组的引用于是基于旧数组又创建了一个新数组并再次将elementData指向它。结果扩容失效最终数组容量可能只是线程B计算的容量但实际需要的容量可能更大线程A已经添加了元素。元素丢失线程A在新数组中添加的元素随着elementData被线程B的引用覆盖而全部丢失。更严重的是线程A之后还会尝试在它自己创建的数组已被抛弃中放入元素这些操作全部无效。3. 迭代过程中的“快速失败fail-fast”当使用迭代器Iterator遍历 ArrayList 时迭代器内部会保存一个expectedModCount值初始等于集合的modCount修改次数。每次遍历都会检查两者是否一致。风险如果在一个线程遍历的同时另一个线程对 ArrayList 进行了结构修改增、删modCount就会变化导致两者不相等。此时正在遍历的线程会立即抛出ConcurrentModificationException这就是为了在并发环境下快速暴露问题而不是让程序在不确定的状态下继续运行。4.总结数据丢失多个线程同时执行add()操作可能导致后写入的数据覆盖前一个数据或size值更新错乱。扩容异常线程A和线程B同时检测到需要扩容都创建了新数组并尝试复制。最终可能只有一个线程的数组生效另一个线程添加的元素全部丢失。快速失败当一个线程使用迭代器遍历时另一个线程修改了集合结构增删迭代器会立即抛出ConcurrentModificationException。二、LinkedList 的线程不安全之源LinkedList 基于双向链表实现其节点Node包含item数据、next后置指针、prev前置指针。它的线程不安全主要体现在对指针和链接状态的并发修改上。1. 链接过程的非原子性以addLast(E e)为例向链表尾部添加元素需要维护多个节点间的指针关系// linkLast 方法 void linkLast(E e) { // 保存当前的尾节点引用 final NodeE l last; // 创建新节点 // 参数说明 // - l: 前驱节点原尾节点 // - e: 新节点存储的元素 // - null: 后继节点为 null因为要放在尾部 final NodeE newNode new Node(l, e, null); // 步骤1更新尾节点指针将 last 指针指向新节点 last newNode; if (l null) // 如果链表为空也要设置 first 指针原链表为空新节点既是头节点也是尾节点 first newNode; else // 步骤2将原尾节点的 next 指针指向新节点原链表非空将原尾节点的 next 指向新节点 l.next newNode; // 步骤3增加 size链表大小加 1 size; // 修改计数器加 1用于快速失败机制 modCount; }风险线程A和线程B同时执行linkLast。它们都可能读到同一个l原尾节点。线程A执行完步骤1将last指向了自己的新节点newNodeA。线程B接着执行步骤1将last指向了自己的新节点newNodeB此时last被线程B覆盖。然后线程A尝试执行步骤2将原尾节点l的next指向newNodeA。线程B也尝试执行步骤2将原尾节点l的next指向newNodeB。结果最终last指向newNodeB但原尾节点的next可能指向newNodeA取决于最后谁执行了步骤2这会导致链表出现环状结构或节点丢失使得后续遍历或操作陷入死循环或产生错误结果。2. 数据结构整体被破坏与ArrayList类似对size的并发增减、在链表中间插入或删除节点时多个线程同时修改节点的prev和next指针极有可能导致指针错乱使得链表不再是一个线性的、可正确遍历的结构甚至出现空指针异常或死循环。例如在中间插入节点时需要同时修改前驱节点的next和后继节点的prev。若两个线程同时在相近位置插入可能造成断链某个节点的next指向了新节点但新节点的prev却未能正确指回导致逆向遍历中断。成环指针交叉引用形成循环链表使遍历永远无法结束。空指针异常某个节点被错误地置为null导致后续访问抛出NPE。3.size与真实节点数不一致size操作不具备原子性多个线程同时执行size会导致最终值小于实际添加次数丢失更新或大于实际节点数重复计数。结合节点丢失的情况size将完全无法反映链表中有效节点的数量使依赖size()的业务逻辑如分页、循环判断失效。4. 迭代器快速失败ConcurrentModificationException与ArrayList一致LinkedList也通过modCount变量记录结构性修改次数。当一个线程使用迭代器遍历时如果另一个线程对链表进行了增删操作modCount的改变会立即被迭代器检测到并抛出ConcurrentModificationException以防止在已损坏或状态不一致的结构上继续操作。三、风险对比与最佳实践集合类不安全根源主要风险表现ArrayList基于数组对索引位置和数组引用的并发赋值非原子扩容时复制覆盖modCount机制触发快速失败。元素覆盖/丢失、数组索引越界、ConcurrentModificationExceptionLinkedList基于链表对多个节点指针prev、next和头尾引用的并发修改非原子size变量并发增减。节点丢失、链表结构损坏如出现环、空指针异常、遍历死循环核心结论与最佳实践局部变量优先如前两份材料所述在绝大多数情况下将ArrayList和LinkedList定义为方法内部的局部变量是避免线程安全问题最简单、最有效的方法。必须共享则加锁或使用并发容器如果确实需要在多线程间共享请不要直接使用它们。对于ArrayList可以根据场景选用Collections.synchronizedList(new ArrayList())简单同步或CopyOnWriteArrayList读多写少。对于LinkedList如果作为队列使用推荐使用ConcurrentLinkedQueue基于 CAS 的无锁并发队列或LinkedBlockingQueue阻塞队列如果仍需 List 操作可考虑Collections.synchronizedList(new LinkedList())但要注意并发性能。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2427854.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!