高性能事业器策画之缓存系长入致性

发布日期:2025-05-10 16:29    点击次数:142
迷水商城

  [[416541]]

缓存系统交互

缓存系统策画是后端开垦东谈主员的必备手段,亦然竣事高并发的蹙迫火器。

关于读多写少的场景,咱们平凡使用内存型数据库行为缓存,相干型数据库行为主存储,从而形成两层相互依赖的存储体系。

共鸣:咱们将使用Redis和MySQL行为缓存和主存的实体,伸开今天的话题。

迷水商城

缓存系统需要处理读取场景和更新场景:

读取时只消之前MySQL和Redis中的数据是一致的,后续只消莫得更新操作就不会有什么问题,借助于内存读取速率来升迁并发智商,这亦然咱们策画缓存系统的初志。

单纯读取的情况并未几,即使是读多写少的业务模子,曾经经会有更新操作,由于操作MySQL和Redis并非自然的原子操作,因此需要咱们寥落处理。

迷水商城迷水商城迷水商城

 

 

迷水商城

 

 

读取经由暗示:

 

 

 

 

读取经由:

读申请优先从缓存中得回数据,拿到后即可复返,完成交互;

如缓存大宗据,则从主存储拿数据,何况将数据更新回写到缓存中,为后续的读取申请作念铺垫。

更新经由之是以会出现数据不一致问题,有表里两大原因:

里面原因:Redis和MySQL的更新不是自然的原子操作,非事务性的组合拳。

外部原因:推行中的读写申请是并发且无序的,可展望性很差,统统不可控。

 

 

 

 

魅色天堂老王论坛洛丽社区 红楼 数据不一致的感知

咱们来看个推行中的例子,进一步了解缓存系统的数据不一致问题。

平常荆棘班挤地铁的时候,咱们平凡会听网易云,比如我可爱听民谣,统共会关怀官方发布的一些民谣歌曲榜单,如图:

这是个相等典型的读多写少的场景,因为歌单是网易云的运营同学建立的,行为用户咱们是无法修改的歌单的内容的。

是以假如我是网易云的后端同学,我笃信会把歌单的信息存储在Redis中,缓存下来升迁性能,大约可以是这个神志:

 

 

365站群VIP

 

 

假如因为版权问题,运营删除了一首歌,此时更新了MySQL,关联词如果Redis中的数据并莫得实时被更新,那么就会有一部分用户在歌单中看到本已被删除的歌曲,点击时可能无法播放等。

画外音:这即是缓存和主存储的数据不一致的好意思瞻念,自然具体网易云是咋竣事的,咱也不明晰,上述的场景熟识作家脑补来诠释不一致问题的直不雅实例。

感性看待不一致问题

数据一致性可以说是分辩式系统中势必存在的问题,数据一致性可以分为:

强一致性:相似刻刻保捏一致。

最终一致性:允许少顷的不一致,关联词终末曾经一致的。

要竣事缓存和主存储的强一致性,需要借助于复杂的分辩式一致性条约等,倒不如毋庸缓存,毕竟缓存的上风曾经读多写少的场景。

画外音:缓存并不是什么万金油,关于写多读少的场景,巧归拢不是妥贴用缓存,劝宇宙不要唯缓存论。

在工程上大部分场景下最终一致性就满盈了,因此咱们将问题动荡为:

在保证数据最终一致性的前提下,怎么把数据不一致带来的影响裁汰到业务可接纳的边界内。 更新曾经删除是个问题

当MySQL被更新时,咱们若那儿理Redis中的老数据呢?

江湖上有两种常见的作念法,咱们一谈来望望:

删除操作 :平直将key淘汰掉,是否再次被加载由后续读申请决定,本次只讲求删除,只管杀岂论埋。 更新操作 :平直update发生变化的key,相等于帮后头的申请作念了加载的操作,管杀管埋。

可以明确少量删除操作平直操作就行,关联词更新操作可能波及的处理关节更多,也即是update比delete更复杂。

还有少量,咱们需要尽量保证Redis中的数据齐是热数据,update每次齐会使得数据驻留在Redis中,巧合这是莫得必要的,因为这些可能是冷数据,至于要加载哪些数据,曾经交给后头的申请比拟合适。

综上,咱们更倾向于将delete操作行为通用的聘用,因此著作后续齐是基于删除缓存的计谋来伸开的。

若那儿置不一致问题

Redis和MySQL的数据不一致产生的根源是: 业务进行更新/写入操作 。

迷水商城

先操作Redis 曾经 先操作MySQL是个问题,操作时序不同产生的影响也不同。

尺有所短,尺有所短,说到底是一种量度,哪一种组合产生的负面影响对业务最小,就倾向于哪种决议。

缓存系统的数据不一致问题,是个经典的问题,因此笃信有许多处置问题的套路,是以让咱们带着分析和想考去望望,各个决议的锋利。

想路一:缔造缓存逾期时期

当向Redis写入一条数据时,同期缔造逾期时期x秒,业务不同逾期时期不同。

逾期时期到达时Redis就会删掉这条数据,后续读申请Redis出现Cache Miss,氟班色林吃后自述进而读取MySQL,然后把数据写到Redis。

如果发生更新操作时,只操作MySQL,那么Redis中的数据更新就仅仅依赖于逾期时期来保底。

迷水商城

换句话说: 如果某个key的数据当今在缓存中,当数据发生更新时,只写MySQL并不写Redis,在更新数据后且缓存逾期前的这段时期内,读取的数据是不一致的。

画外音:这种决议是最简便的,如果业务对短时期不一致问题并不看重,缔造逾期时期的决议就满盈了,莫得必要搞太复杂。

想路二:先淘汰缓存&再更新主存

为了退缩其他线程读到缓存中的旧数据,干脆淘汰掉,然后把数据更新到主存储,后续的申请再次读取时触发Cache Miss,从而读取MySQL再将新数据更新到Redis。

 

 

迷水商城

 

 

在T1时间:Redis和MySQL关于age的值齐是18,二者一致;

在T2时间:有更新申请需要缔造age=20,此时Redis中就莫得age这个数据了;在完成Redis淘汰后,进行MySQL数据更新age=20;

这个决议听着还可以的神志,关联词读写申请齐是并发的,先后法例统统无法展望,以致后发出的申请先处理完成,亦然很常见的。

因此就变成一个明显的瑕玷: 在淘汰Redis的数据完成后,更新MySQL完成之前,这个时期段内如果有新的读申请过来,发现Cache Miss了,就会把旧数据再行写到Redis中,再次变成不一致,何况毫无察觉后续读的齐是旧数据。

 

 

 

 

画外音:这个决议其实不可说统统莫得效,关联词至少不竣工吧,还可以再想想别的决议。

想路三:先更新主存&再淘汰缓存

先更新MySQL,凯旋之后淘汰缓存,后续读取申请时触发Cache Miss再将新数据回写Redis。

这种花样在更新MySQL和淘汰Redis这段时期内,申请读取的曾经Redis的旧数据,不外等MySQL更新完成,就可以坐窝复原一致,影响相对比拟小。

关联词,假如T0时间读取的数据在缓存莫得,那么触发Cache Miss后会产生回写,假如这个回写动作是在T4时间完成,那么写入的曾经老数据,如图:

 

 

 

 

这种情况照实有问题,关联词果真好巧不巧:

事件A:更新MySQL前出现一个读申请,且缓存中大宗据出现cache miss

事件B:T3时间回写Redis的操作才完成,在此之前T2时间拆除了缓存

迷水商城

那么发生问题的概率即是P(A)*P(B),从推行磋商这种抽象事件发生的概率相等低,因为写操作远慢于读操作。

迷水商城

也即是推行场景中上图中更新MySQL&淘汰缓存的操作耗时更久,可以把之前回写到Redis老数据给根猬缩。

迷水商城迷水商城

画外音:先更新MySQL再淘汰Redis的决议,诚然存在小概率不一致问题,关联词总体来说工程上是可用的,比如非要说写完MySQL挂了,Redis就没淘汰,这种情况只可说照实有问题。

想路四:延时双删计谋

前边提到的想路二和想路三齐唯唯一次Redis淘汰操作,这里要说的延时双删推行上是想路二和想路三的迷惑:

 

 

迷水商城

 

 

说真话个东谈主以为,这个决议有点堆操作的嗅觉,而且缔造延时的指标是为了幸免想路三的小概率问题,延时缔造多久不好详情,二来延时裁汰了并发性能,同期前置的删除缓存操作起到的作用并不大。

这个决议倒是表现出一种想想:多删几次,可能一致性更有保证,那照实如斯。

画外音:这个决议也不是说不行,其实有点冗忙,何况在复杂高并发场景中反而影响性能,如果一般的场景巧合也能用起来。

想路五:异步更新缓存

既然平直操作MySQL和Redis齐若干存在一些问题,那么能不可引入中间层来处置问题呢?

把MySQL的更新操作完成后对抗直操作Redis,而是把这个操作号令(音问)扔到一个中间层,然后由Redis我方来蹧跶更新数据,这是一种解耦的异步决议。

 

 

 

 

单纯为了更新缓存引入中间件照实有些复杂,关联词像MySQL提供了binlog的同步机制,此时Redis就行为Slave进行主从同步,竣事数据的更新,资本也还可以接纳。

画外音:引入中间层想想果真万金油啊!

追忆一下

本文主要先容了以下几个症结内容:

缓存系统适用的场景:读多写少。

缓存系统的读写基本交互经由,读很简便,写有点复杂。

缓存系统写时的不一致问题有表里两个成分:外部读写的并发无序性和里面操作非原子性。

使用缓存系统,咱们就需要接纳最终一致性的前提,不然不提出用缓存。

处置缓存数据不一致的想路有许多,或多或少齐有不及,具体用哪种,需要凭据推行业务场景,莫得哪种决议是广博适用的。