一级缓存基于SqlSession,生命周期短,默认开启,提升单会话内重复查询性能;二级缓存基于Mapper命名空间,跨SqlSession共享,需手动配置,适用于读多写少场景,但分布式环境下需结合Redis等外部缓存保证一致性,二者均不能替代数据库查询。
MyBatis 的一级缓存和二级缓存,说到底,它们都是为了提升数据访问速度、减轻数据库压力而存在的,但它们的作用范围、生命周期和使用方式却大相径庭。简单来说,一级缓存是基于
SqlSession的,生命周期很短,默认就开启了;而二级缓存则是基于
Mapper的,生命周期更长,但需要我们手动去开启和配置。
理解MyBatis的缓存机制,就像理解不同层级的记忆。一级缓存(Local Cache)就像我们大脑的短期记忆,它与当前的
SqlSession绑定。当你在一个
SqlSession中执行查询操作时,MyBatis会把查询结果存到这个
SqlSession的内部缓存里。如果后续在这个同一个
SqlSession中,再次执行完全相同的查询(包括SQL语句和参数),MyBatis就不会再去触碰数据库,而是直接从一级缓存中取出结果。它的生命周期与
SqlSession相同,
SqlSession关闭、提交或回滚时,一级缓存就会被清空。这是MyBatis为了避免在一次数据库会话中重复查询相同数据而做的优化,默认开启,你几乎不用关心它。但这也意味着,不同
SqlSession之间是无法共享一级缓存的。
二级缓存(Global Cache),则更像是我们长期记忆中的某个特定主题区域。它与
Mapper的命名空间绑定,是跨
SqlSession共享的。这意味着,只要是查询同一个
Mapper下的数据,并且开启了二级缓存,那么即使是不同的
SqlSession,也能共享这份缓存数据。它的生命周期更长,可以配置在应用程序的整个运行周期内有效。但二级缓存默认是关闭的,需要我们手动在
mybatis-config.xml中全局开启,并在对应的
Mapper.xml文件中配置
标签。要使用二级缓存,缓存的Java对象必须实现
Serializable接口,因为缓存的数据可能需要被序列化存储。每次对数据库的增删改操作,都会导致对应
Mapper的二级缓存失效,以保证数据的一致性。
在我看来,MyBatis一级缓存之所以默认开启,更多的是出于一种“就近原则”和“事务内性能优化”的考量。你想想看,在一个事务或者一次业务操作中,我们经常会连续查询某条数据好几次,比如先查询用户详情,然后基于详情做一些判断,再可能因为某些逻辑需要再次确认用户状态。如果每次都去数据库跑一圈,那性能损耗会非常大。
好处显而易见:
SqlSession内重复查询相同数据,可以显著减少数据库访问次数,降低数据库负载,提升响应速度。
但它也并非没有潜在问题,这往往体现在我们对SqlSession
生命周期管理不当的时候:
SqlSession中先查询了数据A,然后数据库外部(比如另一个应用实例或直接操作数据库)修改了数据A,而你在这个
SqlSession中又没有执行任何增删改操作,再次查询数据A时,你仍然会从一级缓存中获取到旧数据。这并不是MyBatis的“错误”,而是我们对缓存机制和
SqlSession生命周期理解不够深入导致的。
SqlSession中查询了大量不同的数据,一级缓存可能会占用较多内存。虽然
SqlSession的生命周期通常较短,这个问题一般不严重,但在某些极端情况下也需要注意。
配置和使用MyBatis的二级缓存,需要我们多做几步,但带来的好处也是跨会话的。首先,你需要确保全局配置中
cacheEnabled为
true(默认就是)。接着,在你的
Mapper.xml文件中,简单地添加一个
标签就行了,比如:
flushInterval="60000" size="512" readOnly="true"/>
你也可以指定自定义的缓存实现,比如集成Ehcache或Redis:
。当然,别忘了你的实体类
User需要实现
Serializable接口。
它对分布式环境的影响,这才是二级缓存最需要我们深思熟虑的地方。 MyBatis自带的二级缓存实现,默认是基于内存的,这意味着它只在单个应用实例中有效。如果你的应用部署在多个服务器上(也就是分布式环境),那么每个服务器都会有自己独立的二级缓存。
问题就来了: 假设服务器A更新了数据,它会清空自己本地的二级缓存。但服务器B、C、D的二级缓存并不知道这个更新,它们仍然可能提供旧的数据。这就导致了数据不一致性。
如何解决呢?
要说什么时候应该用二级缓存,我个人觉得,这得看你的业务场景对“数据新鲜度”和“性能”的权衡。它不是万能药,更不是数据库的替代品。
理想的使用场景:
但二级缓存绝不能,也永远无法,完全替代数据库查询。
一权威。缓存只是数据库的“副本”,它永远存在数据滞后的风险。所以,二级缓存更像是一个性能优化的“加速器”,它工作在数据库的前面,通过牺牲一点点数据实时性来换取显著的性能提升。它永远是数据库的辅助,而不是替代品。在决定是否使用二级缓存时,务必结合你的业务特性、数据访问模式以及对数据一致性的容忍度来综合考量。