17370845950

新闻动态

Java并发编程避坑指南：8种常见死锁场景与解决方案

死锁是Java并发编程中多个线程因循环等待资源而陷入的永久阻塞状态。文章详细分析了8种常见死锁场景及解决方案：1. 经典资源顺序死锁，通过统一锁获取顺序避免；2. 多资源有序死锁，采用全局资源编号并按序获取；3. 数据库死锁，确保事务访问表顺序一致并缩短持有锁时间；4. 嵌套同步块死锁，保持嵌套锁获取顺序一致；5. 外部方法回调死锁，避免持锁时调用外部方法，使用tryLock或细粒度锁；6. 线程池任务提交死锁，合理配置线程池或分离任务队列；7. JMX/RMI远程调用死锁，采用异步通信与超时机制；8. CountDownLatch或CyclicBarrier误用，设计合理等待条件并设置超时。此外，文章介绍了使用jstack、JConsole等工具检测死锁的方法，并指出并发编程中还需警惕饥饿、活锁、可见性、原子性、有序性和线程安全等问题。在微服务架构下，传统死锁解决方案仍适用于服务内部，但需结合Saga模式、消息队列、分布式锁和熔断限流等机制应对分布式死锁风险。

在Java并发编程的复杂世界里，死锁就像是一个隐匿的陷阱，一旦触发，整个系统就可能陷入停滞，响应全无。它本质上是多个线程相互等待对方释放资源，从而形成一个循环依赖，谁也无法继续执行的僵局。理解这些常见的死锁场景并掌握规避策略，是每个Java开发者确保系统稳定性和响应性的关键一步。这不仅仅是理论知识，更是我们日常调试和系统设计中不得不面对的真实挑战。

解决方案

死锁并非无法避免，关键在于我们如何设计和管理共享资源的访问。以下是8种常见的死锁场景及其对应的解决方案：

1. 经典资源顺序死锁 (A等待B，B等待A)

这是最常见也最容易理解的死锁形式。两个或多个线程各自持有一个资源，并尝试获取对方持有的另一个资源。

场景描述: 线程1持有资源A，尝试获取资源B；同时，线程2持有资源B，尝试获取资源A。

示例:

Object lockA = new Object();
Object lockB = new Object();

// Thread 1
new Thread(() -> {
    synchronized (lockA) {
        System.out.println("Thread 1: Holding lockA...");
        try { Thread.sleep(10); } catch (InterruptedException e) {}
        System.out.println("Thread 1: Waiting for lockB...");
        synchronized (lockB) {
            System.out.println("Thread 1: Holding lockA & lockB.");
        }
    }
}).start();

// Thread 2
new Thread(() -> {
    synchronized (lockB) { // 注意这里，如果先获取lockB
        System.out.println("Thread 2: Holding lockB...");
        try { Thread.sleep(10); } catch (InterruptedException e) {}
        System.out.println("Thread 2: Waiting for lockA...");
        synchronized (lockA) {
            System.out.println("Thread 2: Holding lockB & lockA.");
        }
    }
}).start();

解决方案: 强制所有线程以相同的顺序获取锁。如果所有线程都先获取
```
lockA
```
，再获取
```
lockB
```
，那么死锁就不会发生。这听起来简单，但在复杂的系统中，维护这种一致性需要严格的约定和代码审查。

2. 多资源有序死锁 (环路等待)

这是经典死锁的扩展，涉及三个或更多资源，形成一个等待环。

场景描述: 线程1持有资源A，等待B；线程2持有资源B，等待C；线程3持有资源C，等待A。
解决方案: 同样是资源排序策略。给所有共享资源一个全局的、一致的获取顺序。例如，如果资源有编号，就总是按编号从小到大获取。

3. 数据库死锁 (事务死锁)

当Java应用与数据库交互时，如果多个事务并发执行，且它们更新或锁定资源的顺序不一致，就可能导致数据库层面的死锁。

场景描述: 事务1更新表A的行X，然后尝试更新表B的行Y；事务2更新表B的行Y，然后尝试更新表A的行X。
解决方案:
- 一致的访问顺序: 在应用层面，尽量确保对数据库表的访问顺序一致。
- 缩短事务时间: 减少事务持有锁的时间。
- 使用
  FOR UPDATE
  等排他锁时要谨慎: 仅在必要时使用，并确保范围最小化。
- 数据库自身的死锁检测与回滚机制: 大多数数据库都有内置的死锁检测机制，会选择一个事务作为牺牲品进行回滚。Java应用需要捕获并处理这类异常（如
```
SQLException
```
  ），然后重试事务。

4. 嵌套同步块死锁

当一个线程在一个同步块内部又尝试获取另一个同步块的锁时，如果获取顺序不当，就可能导致死锁。

场景描述: 线程1执行

synchronized(obj1) { synchronized(obj2) { ... } }

，而线程2执行

synchronized(obj2) { synchronized(obj1) { ... } }

。

解决方案: 遵循与经典资源死锁相同的原则：确保嵌套锁的获取顺序在所有相关线程中保持一致。

5. 外部方法回调死锁

当一个线程持有锁A，然后调用一个外部（或可能由第三方库提供的）方法，而这个外部方法又尝试获取锁A，或者获取了锁B后，又回调到当前线程，当前线程又尝试获取锁B，这都可能形成死锁。

场景描述: 线程A持有锁M，调用
```
service.call()
```
；
```
service.call()
```
在内部又尝试获取锁M。或者，
```
service.call()
```
获取锁N，然后回调线程A的某个方法，该方法又尝试获取锁N。
解决方案:
- 避免在持有锁的情况下调用外部或可疑方法。 如果必须调用，考虑使用
```
ReentrantLock
```
  的
```
tryLock()
```
  方法，并设置超时，以避免无限等待。
- 细粒度锁: 尽可能缩小锁的范围，只锁定真正需要保护的代码段。
- ReadWriteLock: 如果读操作远多于写操作，
```
ReadWriteLock
```
  可以提高并发性，减少死锁的可能性。

6. 线程池任务提交死锁

这种死锁相对隐蔽，发生在线程池中，当任务A提交到线程池，而任务A又需要等待任务B完成，而任务B又被提交到同一个已满的线程池中。

场景描述: 线程池的容量有限，任务A提交后，需要等待任务B的结果。但任务B迟迟无法执行，因为它前面有太多任务，或者任务B需要等待任务A释放某个资源。如果任务B是任务A的子任务，并且提交到同一个线程池，且线程池已满，那么任务A就永远等不到任务B的完成。
解决方案:
- 合理设置线程池大小: 根据任务类型（CPU密集型或IO密集型）和系统资源来设置。
- 分离线程池: 对于可能存在依赖关系的任务，考虑使用不同的线程池。例如，长耗时任务和短耗时任务用不同的池。
- 使用
  CompletableFuture
  或
  Future
  的
  get(timeout)
  : 避免无限期等待，设置超时时间，及时发现并处理潜在的阻塞。

7. JMX/RMI 远程调用死锁

在分布式系统中，如果多个服务之间通过JMX或RMI进行同步调用，并形成循环依赖，就可能导致跨进程或跨JVM的死锁。

场景描述: 服务A通过RMI调用服务B，服务B在处理过程中又通过RMI调用服务A。如果这两个调用都是同步阻塞的，就可能形成死锁。
解决方案:
- 异步调用: 尽可能使用异步通信机制（如消息队列、
```
CompletableFuture
```
  ）来解耦服务间的依赖。
- 超时机制: 为所有远程调用设置合理的超时时间，避免无限期等待。
- 服务依赖分析: 在设计阶段就明确服务间的调用关系，避免循环依赖。

CountDownLatch

或
CyclicBarrier
误用导致的死锁

这些并发工具通常用于协调多个线程的执行，但如果等待条件永远无法满足，或者等待的线程本身就是提供条件的线程，就可能导致死锁。

场景描述: 一个线程等待
```
CountDownLatch
```
计数归零，但归零的条件需要这个线程自己去满足，或者满足条件的线程因为其他原因被阻塞。
解决方案:
- 仔细设计等待条件: 确保所有参与者都能正常完成其任务，从而使
```
CountDownLatch
```
  或
```
CyclicBarrier
```
  能够正常达到其目标状态。
- 使用超时: 在
```
await()
```
  方法中加入超时机制，避免无限期等待。
- 避免循环依赖: 确保等待的线程不会同时是满足等待条件的线程。

如何高效检测和定位Java应用中的死锁问题？

死锁的检测和定位，往往比预防来得更紧急，也更考验我们的工程实践能力。毕竟，代码不是一次写成就完美的，线上问题总会不期而至。

首先，最直观的线索是系统响应变慢甚至完全停滞，CPU占用率可能不高，但线程却大量处于

BLOCKED

状态。这时候，我们通常会借助JVM提供的工具来获取线程快照（Thread Dump）。

jstack
工具: 这是JVM自带的命令行工具，用于生成Java进程的线程快照。
```
jstack -l 
```
（其中
是Java进程的ID）会打印出所有线程的调用栈，包括它们当前的状态、正在等待的锁以及持有的锁。在输出中，你会清晰地看到JVM是否检测到了死锁。它会明确指出哪些线程参与了死锁，它们各自持有什么锁，以及正在等待什么锁。这是定位死锁的“黄金标准”。我个人的经验是，一旦发现系统异常卡顿，
```
jstack
```
就是我的第一反应，连续获取几份快照（比如间隔几秒），可以帮助我们观察线程状态的变化，进一步确认问题。
JVM监控工具 (JConsole, VisualVM): 这些图形化工具提供了更友好的界面来查看JVM的运行时数据。它们可以连接到本地或远程的Java进程，提供实时的线程监控。在线程选项卡中，你可以看到每个线程的状态，包括
```
RUNNABLE
```
、
```
BLOCKED
```
、
```
WAITING
```
等。更重要的是，它们通常会有死锁检测功能，一旦检测到死锁，会直接在界面上报警并指出涉及的线程。虽然它们不如
```
jstack
```
那样直接提供原始数据，但对于快速诊断和可视化分析非常有效。
日志分析: 虽然日志本身不会直接告诉你死锁，但如果你的应用有良好的日志记录习惯，记录了线程的生命周期、锁的获取和释放（在开发阶段可以加入DEBUG级别的日志），那么在死锁发生后，回溯日志可以帮助你理解线程的执行路径，从而推断出死锁的形成过程。这是一种事后分析的手段，但对于理解复杂死锁的来龙去脉非常有帮助。
代码审查和静态分析: 在开发阶段，通过严格的代码审查，特别是对涉及多线程和共享资源的代码块，可以及早发现潜在的死锁风险。一些静态代码分析工具（如FindBugs、SonarQube）也能检测出一些常见的并发问题，包括一些简单的死锁模式。当然，它们无法捕捉所有运行时动态形成的死锁，但作为预防手段，不失为一种有效的补充。

定位死锁的关键在于理解线程快照中的

BLOCKED

状态和

waiting for monitor entry

、

waiting to lock

等信息，并结合

locked

和

holding a monitor

来识别锁的持有者和等待者。一旦识别出参与死锁的锁和线程，我们就可以回到代码中，审查这些锁的获取顺序，从而找到问题根源。

除了死锁，Java并发编程中还有哪些值得警惕的常见陷阱？

Java并发编程的坑远不止死锁一个，它是一个充满挑战的领域。在我看来，除了死锁，还有几个“老面孔”经常让开发者头疼，它们同样会导致系统行为异常、性能下降甚至数据损坏。

活性问题 (Liveness Issues) - 除了死锁还有饥饿和活锁:
- 饥饿 (Starvation): 某个线程因为优先级太低，或者总是得不到它需要的资源（例如，一个高优先级的线程总是抢占了低优先级线程的CPU时间），导致它永远无法执行。这与死锁不同，死锁是所有线程都无法执行，而饥饿是一个或几个线程无法执行。
- 活锁 (Livelock): 线程并没有阻塞，它们一直在忙碌地执行，但却无法取得任何进展。例如，两个线程都尝试避让对方，结果却陷入了无限循环的互相避让，谁也无法通过。这就像两个人都在狭窄的过道上想给对方让路，结果左右摇摆，谁也过不去。
可见性问题 (Visibility Issues):
- 当一个线程修改了共享变量的值，另一个线程却可能看不到这个修改。这通常是因为处理器缓存的存在。每个处理器都有自己的缓存，修改可能只在当前处理器的缓存中可见，而没有及时刷新到主内存，导致其他处理器上的线程读取到旧值。
- 解决方案: 使用
```
volatile
```
  关键字（确保变量的可见性，但不保证原子性）、
```
synchronized
```
  关键字（保证可见性和原子性）、
```
ReentrantLock
```
  等
```
java.util.concurrent
```
  包下的锁，或者
```
Atomic
```
  类族。
原子性问题 (Atomicity Issues):
- 一个操作或一系列操作，如果不是原子的，就可能在执行过程中被其他线程打断，导致数据不一致。例如，
```
i++
```
  看起来是一个操作，但实际上包含了读取
```
i
```
  、
```
i
```
  加1、写入
```
i
```
  三个步骤，这三个步骤在多线程环境下并非原子操作。
- 解决方案: 使用
```
synchronized
```
  、
```
ReentrantLock
```
  等锁机制来保护临界区，确保同一时间只有一个线程访问共享资源。或者使用
```
java.util.concurrent.atomic
```
  包下的原子类（如
```
AtomicInteger
```
  ），它们提供了无锁的原子操作。
有序性问题 (Ordering Issues):
- 编译器和处理器为了优化性能，可能会对指令进行重排序。在单线程环境下，这种重排序不会改变程序的最终结果（as-if-serial语义），但在多线程环境下，如果没有适当的同步，重排序可能导致意想不到的结果。
- 解决方案:
```
volatile
```
  关键字除了保证可见性，还通过内存屏障阻止了指令重排序。
```
synchronized
```
  和
```
ReentrantLock
```
  等锁机制也能提供内存屏障，保证临界区内的有序性。
线程安全问题 (Thread Safety Issues) - 集合类非线程安全:
- 许多Java集合类（如
```
ArrayList
```
  、
```
HashMap
```
  ）都是非线程安全的。在多线程环境下直接使用它们进行读写操作，可能导致
```
ConcurrentModificationException
```
  、数据丢失或不一致。
- 解决方案: 使用
```
java.util.concurrent
```
  包下提供的线程安全集合类（如
```
ConcurrentHashMap
```
  、
```
CopyOnWriteArrayList
```
  ），或者通过
```
Collections.synchronizedList()
```
  等方法包装非线程安全的集合。

这些问题往往相互关联，一个系统的并发问题可能由多种陷阱共同导致。因此，在进行并发编程时，我们需要时刻保持警惕，深入理解JVM内存模型和各种并发工具的底层原理。

在现代微服务架构下，传统的死锁解决方案是否依然适用？

微服务架构的兴起，确实给传统的并发问题，特别是死锁，带来了新的视角和挑战。在我看来，传统的死锁解决方案在微服务环境中，既有其适用性，也需要结合分布式特性进行扩展和调整。

传统解决方案的适用性：

首先，微服务内部的死锁问题，比如单个服务内部的多个线程争抢同一个数据库连接池的资源，或者服务内部的业务逻辑涉及多个

synchronized

块，这些仍然是典型的Java并发死锁问题。对于这些“服务内”的死锁，我们前面讨论的那些策略——如锁的获取顺序一致性、使用
tryLock
、细粒度锁、合理配置线程池——依然是行之有效的。毕竟，一个微服务本质上还是一个运行在JVM上的Java应用，JVM层面的并发原语和问题本质没有改变。

微服务架构带来的新挑战与扩展：

微服务架构的特点是服务自治、分布式部署。这意味着死锁可能不再仅仅局限于单个JVM内部，而可能蔓延到跨服务的层面，形成“分布式死锁”。

分布式事务与分布式死锁: 当一个业务操作需要跨越多个微服务时，就会涉及到分布式事务。如果这些服务在处理过程中，各自锁定了资源，并且形成了循环依赖，那么就会出现分布式死锁。例如，服务A调用服务B，服务B更新数据库X并持有锁，同时服务B又调用服务C，服务C更新数据库Y并持有锁，而服务A在等待服务C返回的同时，也可能持有某个资源锁，如果形成环路，就可能导致分布式死锁。
- 解决方案: 传统的两阶段提交（2PC）或三阶段提交（3PC）协议可以解决分布式事务的原子性问题，但它们本身复杂且性能开销大，容易引入阻塞。更现代的微服务架构倾向于使用最终一致性和补偿机制来处理分布式事务，例如：
  - Saga模式: 将一个分布式事务分解为一系列本地事务，每个本地事务都有一个对应的补偿操作。如果某个本地事务失败，可以通过执行之前所有成功本地事务的补偿操作来回滚整个分布式事务。这避免了长时间持有锁，从而减少了死锁的可能性。
  - 消息队列: 通过异步消息传递来协调服务间的操作。服务完成自身操作后，发送消息给下一个服务，而不是同步等待。这极大地降低了服务间的耦合度，自然也减少了同步阻塞和死锁的风险。
资源竞争与分布式锁: 在微服务环境中，多个服务实例可能同时竞争同一个共享资源（例如，一个文件、一个外部API的调用限额、数据库中的某个特定记录）。如果处理不当，也可能导致类似于死锁的资源争用问题。
- 解决方案:
  - 分布式锁 (Distributed Locks): 例如基于Redis（Redisson）、ZooKeeper或数据库实现的分布式锁。这些锁允许在分布式环境中协调对共享资源的访问。但使用分布式锁同样需要谨慎，要考虑锁的过期时间、可重入性、公平性以及避免“脑裂”等问题。同样，获取分布式锁的顺序一致性原则依然适用。
  - 幂等性设计: 确保服务接口是幂等的，即多次调用产生相同的结果，这样即使请求重试也不会造成副作用，降低了对严格锁机制的依赖。
  - 限流与熔断: 通过限流保护下游服务不被压垮，通过熔断机制在下游服务不可用时快速失败，避免请求长时间阻塞，从而间接减少了因服务间依赖导致的死锁风险。

总而言之，在微服务架构下，我们仍然需要关注服务内部的并发问题，并应用传统的死锁解决方案。但同时，我们也必须将视野扩展到服务间，利用异步通信、最终一致性、分布式锁以及服务治理（限流、熔断）等微服务特有的模式和工具，来解决或规避分布式环境下的“死锁”及其变种问题。这要求我们对整个系统架构有更全面的理解，而不仅仅是单个服务的代码逻辑。

17370845950

解决方案

如何高效检测和定位Java应用中的死锁问题？

除了死锁，Java并发编程中还有哪些值得警惕的常见陷阱？

在现代微服务架构下，传统的死锁解决方案是否依然适用？

关于我们

服务项目

广告推广

案例欣赏