缓存穿透和雪崩

————————————— 一般做缓存都用redis —————————————

缓存穿透

概念

缓存穿透的概念很简单,用户想要查询一些数据,发现redis内存数据库中没有,也就是缓存没有命中,于是想持久层数据库查询。当用户很多的时候,缓存都没有命中(秒杀),于是都去请求了持久层数据库。这会给持久层数据可很大的压力,这个时候就相当于出现了缓存穿透。

img点击并拖拽以移动

解决方案

布隆过滤器

布隆过滤器是一种数据结构,对所有可能查询的参数以hash形式存储,在控制层先进行检验, 判断缓存是否存在,不存在则丢弃该请求 ,从而避免了对底层存储系统的压力。

img点击并拖拽以移动

缓存空对象

当缓存没命中,存储层也没有查到数据后,存储层返回一个空对象并将其缓存起来,同时设置一个过期时间,之后再访问这个数据将会从缓存中获取这个空值,保护了后端数据源。

img点击并拖拽以移动

但是这种方法有两个问题:

  • 如果空值被缓存起来,这就意外着缓存需要更多的空间来存储的键,以为其中有很多空值的键
  • 即使对空值设置了过期时间,还是会存在缓存层和存储层的数据会有一段时间窗口的不一致,这对于需要保持一致性的业务会有影响。

缓存击穿

概念

这里需要注意和缓存击穿的区别,缓存击穿,是指一个key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个屏障上凿开了一个洞。

当某个key在过期的瞬间,有大量的请求并发访问,这类数据一般是热点数据(比如热搜),由于缓存过期,会同时访问数据库来查询最新数据,并且回写缓存,会导使数据库瞬间压力过大。

注意缓存穿透和缓存过期的区别:

缓存穿透是在大量查询请求在缓存中查不到,便会去查询底层数据库,增大数据库压力。而缓存击穿是大量的访问单个key,key失效瞬间这些大量请求便会去查询底层数据库,增大数据库压力。

解决方案

设置热点数据永不过期

从缓存层面来看,没有设置过期时间,所以不会出现热点key过期后产生的问题。

采用分布式锁

分布式锁:使用分布式锁,保证对于每个key同时只有一个线程去查询后端服务(底层数据库),其他线程没有获得分布式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大。

缓存雪崩

概念

缓存雪崩,就是指在某一时间段,缓存集中过期失效 (或大面积的缓存击穿) 或者Redis宕机

比如在写本文的时候,马上就要到双十二零点,很快就会迎来一波抢购,这波商品时间比较集中的放入了缓存,假设缓存一个小时。那么到了凌晨一点钟的时候,这批商品的缓存就都过期了。而对这批商品的访问查询,都落到了数据库上,对于数据库而言,就会产生周期性的压力波峰。于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。

img点击并拖拽以移动

其实缓存集中过期,倒不是非常致命,比较致命的缓存雪崩,是缓存服务器某个节点宕机或断网。因为自然形成的缓存雪崩,一定是在某个时间段集中创建缓存,这个时候,数据库也是可以顶住压力的。无非就是对数据库产生周期性的压力而已。而缓存服务节点的宕机,对数据库服务器造成的压力是不可预知的,很有可能瞬间就把数据库压垮。

解决方案

Redis高可用

这个思想的含义是,既然redis有可能挂掉宕机,那我多增设几台redis,这样一台挂掉之后其他的还可以继续工作,其实就是通过主从复制搭建集群

限流降级

这个解决方案的思想是,在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。

数据预热

数据预热的含义就是在正式部署之前,我先把可能的数据先预先访问一遍,这样部分可能大量访问的数据就会加载到缓存中。在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀。