一、什么是BASE理论?
BASE理论是对分布式系统设计和处理的一种理论指导,相对于ACID(原子性、一致性、隔离性和持久性)这一强一致性模型,BASE更强调在分布式系统中牺牲强一致性以获得可用性和性能的平衡。
BASE 理论是当今互联网分布式系统的实践总结,它的核心思想在于,既然在分布式系统中实现强一致性的代价太大,那不如退而求其次。
只需要各应用分区在提供高可用服务的基础上,尽最大能力保证数据一致性,也就是保证数据的最终一致性。
BASE 理论是 CAP 中保证分区容错(P)的前提下,对可用性(A)和一致性(C)的权衡,它由 Basically Available(基本可用),Soft State(软状态),Eventually-Consistent(最终一致性) 三方面构成,简称 BASE 理论。
分布式系统中,CAP 理论提供了一个理论框架,而 BASE 理论则提供了一种实际操作的指导原则。
二、BASE理论的具体内容
2.1、基本可用(Basically Available)
当系统遇到某些不可抗力的异常时,仍然能够保障“可用性”,会在限定时间内返回一个明确的结果,主要体现在以下 2 方面:
-
时效性的变化:响应时间可以适当延长。正常情况下的搜索引擎0.5秒即返回给用户结果,而基本可用的搜索引擎可以在2秒返回结果。
-
功能完整性的变化:功能降级,但被降级的功能要尽量少,且即使降级返回的结果也必须是明确的,不能让用户困惑。在一个电商网站上,正常情况下,用户可以顺利完成每一笔订单。但是到了大促期间,为了保护购物系统的稳定性,部分消费者可能会被引导到一个降级页面。
2.2、软状态(Soft State)
允许系统中的数据存在中间状态,并认为该中间状态的存在不会影响系统的整体可用性,允许系统内节点之间的数据同步存在延时,客户端会读到各副本数据达到一致前的中间状态。
比如我们在购买火车票付款结束之后,就可能处在一个既没有完全成功,也没有失败的中间等待状态。用户需要等待系统的数据完全同步以后,才会得到是否购票成功的最终状态。
BASE 理论认识到,在分布式系统中,状态可能会随时间变化而软化,而不是立即达到一致状态。
2.3、最终一致性(Eventually Consistent)
最终一致性是 BASE 理论的核心思想。它指出,分布式系统可以在一段时间内保持不一致状态,但最终会收敛到一致状态。
它不像强一致性那样,需要分区数据保证实时一致,导致系统数据的同步代价过高。也不像弱一致性那样,数据更新后不保证数据一致,导致后续的请求只能访问到老数据。
当前业界的分布式系统,甚至关系数据库系统的数据,大都是用最终一致性实现的。比如 MySQL 的主从备份,就是在一段时间内通过 binlog
日志和监听线程让从库和主库的数据保持最终一致。
三、总结
总的来说,BASE 理论其实就是牺牲了各节点数据的强一致性,允许不同节点的数据在一段时间内不一致,来获得更高的性能和高可用性。
BASE理论相对于ACID更适用于分布式系统和大规模的互联网应用。在大规模的系统中,强一致性往往会导致性能问题,因为在分布式环境下实现强一致性往往会牺牲系统的可用性和性能。相反,BASE理论提供了一种折衷的方案,允许系统在特定时段下保持数据不一致,但最终会达到一致性的状态。
所以,BASE 理论是我们在实际的分布式系统中经常使用的方案。