CAP 原则又称 CAP 定理,指的是在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可得兼。
CAP含义
- 一致性(C):所有的节点上的数据时刻保持同步。对于客户端的每次读操作,要么读到的是最新的数据,要么读取失败。换句话说,一致性是站在分布式系统的角度,对访问本系统的客户端的一种承诺:要么我给您返回一个错误,要么我给你返回绝对一致的最新数据,其强调的是数据正确。
- 可用性(A):任何客户端的请求都能得到响应数据,不会出现响应错误。换句话说,可用性是站在分布式系统的角度,对访问本系统的客户的另一种承诺:我一定会给您返回数据,不会给你返回错误,但不保证数据最新,强调的是不出错。
- 分区容忍性(P):由于分布式系统通过网络进行通信,网络是不可靠的。当任意数量的消息丢失或延迟到达时,系统仍会继续提供服务,不会挂掉。换句话说,分区容忍性是站在分布式系统的角度,对访问本系统的客户端的再一种承诺:我会一直运行,不管我的内部出现何种数据同步问题,强调的是不挂掉。
CAP 常见模型
对于一个分布式系统而言,P是前提,必须保证,因为只要有网络交互就一定会有延迟和数据丢失,这种状况我们必须接受,必须保证系统不能挂掉。所以只剩下C、A可以选择。要么保证数据一致性(保证数据绝对正确),要么保证可用性(保证系统不出错)。
CAP往往只能三者取二
牺牲分区(CA 模型)
CAP 理论告诉我们分布式系统只能选择 CP 或者 AP,但其实这里的前提是系统发生了“分区”现象。如果系统没有发生分区现象,也就是说 P 不存在的时候(节点间的网络连接一切正常),我们没有必要放弃 C 或者 A,应该 C 和 A 都可以保证,这就要求架构设计的时候既要考虑分区发生时选择 CP 还是 AP,也要考虑分区没有发生时如何保证 CA。
举例:
- 单站点数据库
- 集群数据库
- LDAP
- xFS 文件系统
实现方式:
- 两阶段提交
- 缓存验证协议
牺牲可用性(CP 模型)
CP 原则属于强一致性原则,要求所有节点可以查询的数据随时要报错一致(同步中的数据不可查询),即:若干个节点形成一个逻辑的共享区域,某一个节点更新的数据都会立即同步到其他数据节点中,当数据同步完成后才能返回成功的结果,但是实际的运行过程中网络故障在所难免,如果此时若干个服务节点之间无法通信时就会出现错误,从而牺牲屌了可用性原则(Availability),列如关系数据库中的事务。
举例:
- 分布式数据库
- 分布式锁定
- 绝大部分协议
实现方式:
- 悲观锁
- 少数分区不可用
牺牲一致性(AP 模型)
AP 原则属于弱一致性原则,在集群中只要存活的节点所发送来的所有请求都可以得到正确的回应,在进行数据同步操作中即便某些节点没有成功的实现数据同步也返回成功,这样就牺牲了一致性原则(Consistency)。
这说明:对应数据的同步一定会发出指令,但是最终的节点是否真的实现了同步,并不保证,可是却可以及时的得到数据更新成功的响应,可以应用在网络环境部署很好的场景中。
举例:
- Coda
- Web 缓存
- DNS
实现方式:
- 到期 / 租赁
- 解决冲突
- 乐观