当前位置:网站首页>分布式缓存系统必须要解决的四大问题
分布式缓存系统必须要解决的四大问题
2022-07-31 06:35:00 【Java知音_】
点击关注公众号,实用技术文章及时了解
分布式缓存系统是三高架构中不可或缺的部分,极大地提高了整个项目的并发量、响应速度,但它也带来了新的需要解决的问题,分别是:缓存穿透、缓存击穿、缓存雪崩和缓存一致性问题。
缓存穿透
第一个比较大的问题就是缓存穿透。这个概念比较好理解,和命中率有关。如果命中率很低,那么压力就会集中在数据库持久层。
假如能找到相关数据,我们就可以把它缓存起来。但问题是,本次请求,在缓存和持久层都没有命中,这种情况就叫缓存的穿透。
举个例子,如上图,在一个登录系统中,有外部攻击,一直尝试使用不存在的用户进行登录,这些用户都是虚拟的,不能有效地被缓存起来,每次都会到数据库中查询一次,最后就会造成服务的性能故障。
解决这个问题有多种方案,我们来简单介绍一下。
第一种就是把空对象缓存起来。不是持久层查不到数据吗?那么我们就可以把本次请求的结果设置为 null,然后放入到缓存中。通过设置合理的过期时间,就可以保证后端数据库的安全。
缓存空对象会占用额外的缓存空间,还会有数据不一致的时间窗口,所以第二种方法就是针对大数据量的、有规律的键值,使用布隆过滤器进行处理。
一条记录存在与不存在,是一个 Bool 值,只需要使用 1 比特就可存储。布隆过滤器就可以把这种是、否操作,压缩到一个数据结构中。比如手机号,用户性别这种数据,就非常适合使用布隆过滤器。
缓存击穿
缓存击穿,指的也是用户请求落在数据库上的情况,大多数情况,是由于缓存时间批量过期引起的。
我们一般会对缓存中的数据,设置一个过期时间。如果在某个时刻从数据库获取了大量数据,并设置了同样的过期时间,它们将会在同一时刻失效,造成和缓存的击穿。
对于比较热点的数据,我们就可以设置它不过期;或者在访问的时候,更新它的过期时间;批量入库的缓存项,也尽量分配一个比较平均的过期时间,避免同一时间失效。
缓存雪崩
雪崩这个词看着可怕,实际情况也确实比较严重。缓存是用来对系统加速的,后端的数据库只是数据的备份,而不是作为高可用的备选方案。
当缓存系统出现故障,流量会瞬间转移到后端的数据库。过不了多久,数据库将会被大流量压垮挂掉,这种级联式的服务故障,可以形象地称为雪崩。

缓存的高可用建设是非常重要的。Redis 提供了主从和 Cluster 的模式,其中 Cluster 模式使用简单,每个分片也能单独做主从,可以保证极高的可用性。
另外,我们对数据库的性能瓶颈有一个大体的评估。如果缓存系统当掉,那么流向数据库的请求,就可以使用限流组件,将请求拦截在外面。
缓存一致性
引入缓存组件后,另外一个老大难的问题,就是缓存的一致性。
我们首先来看问题是怎么发生的。对于一个缓存项来说,常用的操作有四个:写入、更新、读取、删除。
写入:缓存和数据库是两个不同的组件,只要涉及双写,就存在只有一个写成功的可能性,造成数据不一致。
更新:更新的情况类似,需要更新两个不同的组件。
读取:读取要保证从缓存中读到的信息是最新的,是和数据库中的是一致的。
删除:当删除数据库记录的时候,如何把缓存中的数据也删掉?
由于业务逻辑大多数情况下,是比较复杂的。其中的更新操作,就非常昂贵,比如一个用户的余额,就是通过计算一系列的资产算出来的一个数。如果这些关联的资产,每个地方改动的时候,都去刷新缓存,那代码结构就会非常混乱,以至于无法维护。
我推荐使用触发式的缓存一致性方式,使用懒加载的方式,可以让缓存的同步变得非常简单:
当读取缓存的时候,如果缓存里没有相关数据,则执行相关的业务逻辑,构造缓存数据存入到缓存系统;
当与缓存项相关的资源有变动,则先删除相应的缓存项,然后在数据库中对资源进行更新,最后再删除相应的缓存项。
这种操作,除了编程模型简单,有一个明显的好处。我只有在用到这个缓存的时候,才把它加载到缓存系统中。如果每次修改 都创建、更新资源,那缓存系统中就会存在非常多的冷数据。这实际上是实现了边缘缓存模式(Cache-Aside Pattern),即按需将数据从数据存储加载到缓存中,最大的作用就是提高性能减少不必要的查询。
但这样还是有问题。接下来介绍的场景,也是面试中经常提及的问题。
我们上面提到的数据库的更新动作,和缓存删除动作,明显是不在一个事务里的。可能造成数据库的内容和缓存里的内容在更新的过程有不一致。
在面试中,只要你把这个问题给点出来,面试官都会跷起大拇指。
可以使用分布式锁来解决这个问题,将数据库操作和缓存操作,与其他的缓存读操作,使用锁进行资源隔离即可。一般来说,读操作是不需要加锁的,它会在遇到锁的时候,重试等待,直到超时。
来源:tomcat.blog.csdn.net/article/details/123762319
推荐
PS:因为公众号平台更改了推送规则,如果不想错过内容,记得读完点一下“在看”,加个“星标”,这样每次新文章推送才会第一时间出现在你的订阅列表里。点“在看”支持我们吧!
边栏推荐
- codec2 BlockPool:不可读库
- 2022.07.18_每日一题
- [PSQL] 复杂查询
- Postgresql source code learning (33) - transaction log ⑨ - see the overall process of log writing from the insert record
- bcos简介及自序
- Zotero | Zotero translator plugin update | Solve the problem that Baidu academic literature cannot be obtained
- 电脑开机密码怎么设置?如何给你的电脑加上“安全锁”
- 强化学习科研知识必备(数据库、期刊、会议、牛人)
- 文件 - 03 下载文件:根据文件id获取下载链接
- ‘vite‘ 不是内部或外部命令,也不是可运行的程序 或批处理文件。
猜你喜欢
LeetCode brush # 376 # Medium - swing sequence
Postgresql source code learning (34) - transaction log ⑩ - full page write mechanism
2022.07.20_Daily Question
iOS大厂面试查漏补缺
单点登录 思维导图
我开发了一个利用 Bun 执行 .ts / .js 文件的 VS Code 插件
03-SDRAM: Write operation (burst)
熟悉而陌生的新朋友——IAsyncDisposable
从入门到一位合格的爬虫师,这几点很重要
【解决】npm ERR A complete log of this run can be found in npm ERR
随机推荐
PCB抄板
MySQL详解
2022.07.14_每日一题
'vite' is not an internal or external command, nor is it a runnable program or batch file.
Financial leasing business
Matlab学习第一天(持续更新中)
2022.07.18_每日一题
2022.07.20_Daily Question
强化学习科研知识必备(数据库、期刊、会议、牛人)
科普 | “大姨太”ETH 和 “小姨太”ETC的爱恨情仇
什么是半波整流器?半波整流器的使用方法
Thread 类的基本用法——一网打尽
The Ballad of Lushan Sends Lu's Servant to the Void Boat
2022.07.12_每日一题
关于求反三角函数的三角函数值
文件 - 05 下载文件:根据文件Id下载文件
Difficulty comparison between high concurrency and multithreading (easy to confuse)
Gradle remove dependency demo
LeetCode brush # 376 # Medium - swing sequence
【网络攻防】常见的网络攻防技术——黑客攻防(通俗易懂版)