2. FLP and CAP¶

分布式系统的核心问题：一致性问题共识问题
引起不一致的因素:

节点间网络通信的不可靠,消息延迟,消息乱序,内容错误.
节点处理时间无法保证: 结果可能错误,或者节点宕机.

2.1. FLP不可能原理¶

FLP不可能原理：在网络可靠，但允许节点失效（即便只有一个）的最小化异步模型系统中，不存在一个可以解决一致性问题的确定性共识算法。（节点失效不可避免，所以不能共识）

FLP 不可能原理告诉大家不必浪费时间去追求完美的共识方案，而要根据实际情况设计可行的工程方案。

那么，退一步讲，在付出一些代价的情况下，共识能做到多好？

回答这一问题的是另一个很出名的原理：CAP 原理。

2.2. CAP 原理¶

CAP原理：分布式计算系统不可能同时确保以下三个特性：强一致性（Consistency）、可用性（Availability）和分区容忍性（Partition），设计中往往需要弱化对某个特性的保证。

一致性：所有节点在同一时刻能够看到相同的数据。
可用性：在有限时间内，任何非失败节点都能应答请求；
分区容忍性：分布式系统在遇到某节点或网络分区故障的时候，仍然能够对外提供满足一致性或可用性的服务。

2.2.1. 一致性解读¶

对于客户端来说，一致性指的是并发访问时更新过的数据如何获取的问题。
从服务端来看，则是更新如何复制分布到整个系统，以保证数据最终一致。

规范来看，分布式系统达成一致的过程，应该满足：

可终止性（Termination）：一致的结果在有限时间内能完成；意味着可以保障提供服务（Liveness）。
约同性（Agreement）：不同节点最终完成决策的结果是相同的；
合法性（Validity）：决策的结果必须是某个节点提出的提案。

CAP 原理认为，分布式系统最多只能保证三项特性中的两项特性。

比较直观地理解，当网络可能出现分区时候，系统是无法同时保证一致性和可用性的。要么，节点收到请求后因为没有得到其它节点的确认而不应答（牺牲可用性），要么节点只能应答非一致的结果（牺牲一致性）。

2.3. CAP应用场景¶

既然 CAP 三种特性不可同时得到保障，则设计系统时候必然要弱化对某个特性的支持。

2.3.1. 弱化一致性¶

对结果一致性不敏感的应用，可以允许在新版本上线后过一段时间才最终更新成功，期间不保证一致性。

例如网站静态页面内容、实时性较弱的查询类数据库等，简单分布式同步协议如 Gossip，以及 CouchDB、Cassandra 数据库等，都为此设计。

2.3.2. 弱化可用性¶

对结果一致性很敏感的应用，例如银行取款机，当系统故障时候会拒绝服务。MongoDB、Redis、MapReduce 等为此设计。

Paxos、Raft 等共识算法，主要处理这种情况。在 Paxos 类算法中，可能存在着无法提供可用结果的情形，同时允许少数节点离线。

2.3.3. 弱化分区容忍性¶

现实中，网络分区出现概率较小，但很难完全避免。

两阶段的提交算法，某些关系型数据库以及 ZooKeeper 主要考虑了这种设计。

实践中，网络可以通过双通道等机制增强可靠性，实现高稳定的网络通信。

2.4. 共识算法¶

针对如上不稳定的情况，把出现故障（Crash 或 Fail-stop，即不响应）但不会伪造信息的情况称为“非拜占庭错误（Non-Byzantine Fault）”或“故障错误（Crash Fault）”；伪造信息恶意响应的情况称为“拜占庭错误”（Byzantine Fault），对应节点为拜占庭节点。显然，后者场景中因为存在“捣乱者”更难达成共识。

共识算法:

BFT类针对拜占庭错误有: PBFT确定性算法、POW工作量证明的概率算法等.
CFT类针对非拜占庭错误有: PAXOS 算法、Raft算法（容错较好,处理快,保证不超过一半节点故障）

2.5. reference¶

常用共识算法总结（Paxos，Raft，PBFT，PoW，PoS，DPoS，Ripple）

blockchain_guide