缓存穿透和雪崩

————————————— 一般做缓存都用redis —————————————

缓存穿透

概念

缓存穿透的概念很简单，用户想要查询一些数据，发现redis内存数据库中没有，也就是缓存没有命中，于是想持久层数据库查询。当用户很多的时候，缓存都没有命中（秒杀），于是都去请求了持久层数据库。这会给持久层数据可很大的压力，这个时候就相当于出现了缓存穿透。

点击并拖拽以移动

解决方案

布隆过滤器

布隆过滤器是一种数据结构，对所有可能查询的参数以hash形式存储，在控制层先进行检验，判断缓存是否存在，不存在则丢弃该请求，从而避免了对底层存储系统的压力。

点击并拖拽以移动

缓存空对象

当缓存没命中，存储层也没有查到数据后，存储层返回一个空对象并将其缓存起来，同时设置一个过期时间，之后再访问这个数据将会从缓存中获取这个空值，保护了后端数据源。

点击并拖拽以移动

但是这种方法有两个问题:

如果空值被缓存起来，这就意外着缓存需要更多的空间来存储的键，以为其中有很多空值的键
即使对空值设置了过期时间，还是会存在缓存层和存储层的数据会有一段时间窗口的不一致，这对于需要保持一致性的业务会有影响。

缓存击穿

概念

这里需要注意和缓存击穿的区别，缓存击穿，是指一个key非常热点，在不停的扛着大并发，大并发集中对这一个点进行访问，当这个key在失效的瞬间，持续的大并发就穿破缓存，直接请求数据库，就像在一个屏障上凿开了一个洞。

当某个key在过期的瞬间，有大量的请求并发访问，这类数据一般是热点数据（比如热搜），由于缓存过期，会同时访问数据库来查询最新数据，并且回写缓存，会导使数据库瞬间压力过大。

注意缓存穿透和缓存过期的区别：

缓存穿透是在大量查询请求在缓存中查不到，便会去查询底层数据库，增大数据库压力。而缓存击穿是大量的访问单个key，key失效瞬间这些大量请求便会去查询底层数据库，增大数据库压力。

解决方案

设置热点数据永不过期

从缓存层面来看，没有设置过期时间，所以不会出现热点key过期后产生的问题。

采用分布式锁

分布式锁：使用分布式锁，保证对于每个key同时只有一个线程去查询后端服务（底层数据库），其他线程没有获得分布式锁的权限，因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁，因此对分布式锁的考验很大。

缓存雪崩

概念

缓存雪崩，就是指在某一时间段，缓存集中过期失效 (或大面积的缓存击穿) 或者Redis宕机！

比如在写本文的时候，马上就要到双十二零点，很快就会迎来一波抢购，这波商品时间比较集中的放入了缓存，假设缓存一个小时。那么到了凌晨一点钟的时候，这批商品的缓存就都过期了。而对这批商品的访问查询，都落到了数据库上，对于数据库而言，就会产生周期性的压力波峰。于是所有的请求都会达到存储层，存储层的调用量会暴增，造成存储层也会挂掉的情况。

点击并拖拽以移动

其实缓存集中过期，倒不是非常致命，比较致命的缓存雪崩，是缓存服务器某个节点宕机或断网。因为自然形成的缓存雪崩，一定是在某个时间段集中创建缓存，这个时候，数据库也是可以顶住压力的。无非就是对数据库产生周期性的压力而已。而缓存服务节点的宕机，对数据库服务器造成的压力是不可预知的，很有可能瞬间就把数据库压垮。

解决方案

Redis高可用

这个思想的含义是，既然redis有可能挂掉宕机，那我多增设几台redis，这样一台挂掉之后其他的还可以继续工作，其实就是通过主从复制搭建集群。

限流降级

这个解决方案的思想是，在缓存失效后，通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存，其他线程等待。

数据预热

数据预热的含义就是在正式部署之前，我先把可能的数据先预先访问一遍，这样部分可能大量访问的数据就会加载到缓存中。在即将发生大并发访问前手动触发加载缓存不同的key，设置不同的过期时间，让缓存失效的时间点尽量均匀。

给个饭钱？

Post author: Sovzn
Post link: http://sovzn.github.io/2021/02/15/%E7%BC%93%E5%AD%98%E7%A9%BF%E9%80%8F%E5%92%8C%E9%9B%AA%E5%B4%A9/
Copyright Notice: All articles in this blog are licensed under unless otherwise stated.