深入理解Paxos算法

1.Paxos算法

Paxos算法是Leslie Lanmport(2013年获图灵奖)在1990年提出的一种基于消息传递的共识算法(也称为，一致性算法)，由于算法难以理解并没有被ACM TOCS发表。直到1998年，才引起人们的注意，Lanmport重新发表文章。为了便于人们通俗地理解Paxos算法，Lanmport于2001年简化原来的文章，发表了Paxos Made Simple，文章循序渐进地推导出了Paxos算法，并用数学归纳法进行了证明。在此基础上，本文结合Paxos Made Simple，与其他优秀的Paxos算法解读，重新描述Paxos协议，希望可以深入理解基本的Paxos算法理论。

Paxos算法解决的问题是一个分布式系统中如何就某个值(或协议)达成一致。在一个分布式系统中，如果各节点的初始状态一致，每个节点都执行相同的操作，那么他们最后的得到的也是一个一致的状态。一个分布式系统中，通常包含一个主节点和多个备节点。为了保证每个节点执行相同的操作指令，需要每一条执行执行一个“一致性算法”来选举出主节点，进而保证每个节点得到的指令一致。这是一个分布式系统中的重要问题。

2.基本概念

Paxos算法中有三种角色：Proposer, Acceptor, Learner。每个节点需要同时扮演 两种或两种以上的角色。

Proposal Value: 提议的值　　
Proposal Number: 提议编号，并且要求提议编号不能冲突　　
Proposal: 提议　=　提议编号 + 提议的值　　
Proposer: 提议发起者　　
Acceptors: 提议接受者　　
Learners: 提议学习者

需要说明的是，Proposer有两种行为，一个是向Acceptors发起Prepare请求，另一个是向Acceptors发起Accept请求。Acceptors则根据协议规则或(自身状态)对Proposers的请求做出应答。Learners根据Acceptors的状态，学习最终被确定的值。

3.两个原则

1安全原则

只能(而且必须)允许一个值被选定；
每个节点只能学习已经被选定的值；

2存活原则

只要多数节点存活，并且彼此可以通信，则会达成以下两件事：

最终会选定某个提议的值　　
一个被选定的值，其他节点最终会学习到这个值

4.算法过程

第一阶段A，即Prepare阶段

Proposer选择一个提议编号n，向所有的Acceptors发送(广播)Prepare(n)请求。

第一阶段B，即Prepare阶段

Acceptor接收到Prepare(n)请求后，若提议编号比之前接收的Prepare提议编号都要大，则做出如下承诺：即不会在接收比n小的提议，并携带之前Accept的提议中编号小于n的最大值的提议，否则不予理会。

第二阶段A，即Accept阶段

Proposer接收到多数Acceptors的承诺后，如果没有一个Acceptor接受过这个值，则向所有的Acceptors的发起自己的值和提议编号，否则从接受过的值中选择对应的提议编号最大的那个值，作为提议的值，提议编号仍为n。

第二阶段B，即Accept阶段

Acceptor接收到Accept请求后，如果该提议编号不违反自己的做过的承诺，则接受提议。

paxos-protocolflow

需要说明是，Proposer发出Prepare请求后，得到多数派的应答，然后再选择一个多数派广播Accept请求，而不一定是将Accept请求发给有应答的Acceptor。这样做的原因是，Prepare阶段得到只是Proposal number 和 Proposal value，而一个值最终是否被选定，还需要Accept阶段的验证。

当一个提议被多数接受后，这个提议的值就被选定choesn，一旦有一个值被选定，那么只有按协议的规则继续演进，后续被选定的值也是同一个值。这就是chosen的一致性问题。

5.算法证明

其实，Paxos算法是一个非常确定的数学问题，可以用数学语言表达，进而用严谨的数学逻辑进行证明。

Paxso算法原命题

如果一个提议{n0,v0}被多数Acceptors所接受，那么不存在提议{n1,v1}被多数Acceptors接受，其中n0 < n1,v1 != v0。

Paxso算法原命题加强

如果一个提议{n0,v0}被多数Acceptors所接受，那么不存在Acceptors接受提议{n1,v1}，其中n0 < n1, v1 != v0。

Paxso算法原命题进一步加强

如果一个提议{n0,v0}被多数Acceptors所接受，那么不存在Proposer发出提议{n1,v1}，其中n0 < n1, v1 != v0。

归纳法证明

假设，提议{m, v}(简称m)被多数派接受，那么提议m到n(n >= m)，对应的值也是v。对n进行归纳假设。

n = m时，显然结论成立。
设n = k时，结论成立，即如果提议(m, v)被多数派接受，则提议m到k对应的值为v。
当n = k + 1时，若提议k+1不存在，则结论成立。

接下来，证明提议提议k+1不存问题。

假设，提议k+1存在，对应的值为v1。因为提议m被多数派接受，又因为提议k+1的Prepare请求被承诺并返回结果。两个多数派必有交集，那么提议k+1的第一阶段B必有提议带回来，那么v1就是从返回的提议中选择出来的，设v1对应的提议编号为t。根据第二阶段B可知，t是返回的提议编号最大的一个，因此t>=m。又因为第一阶段A，t<n。根据假设,t对应的值也是v，即v1 = v。所以，n=k成立时，n=k+1也成立。

6.示例演示

为了便于理解，记(n,v)为提议编号为n,提议的值为v的提议，(m,(n,v))为承诺了Prepare(m)请求，并接受了提议(n,v)。

simple-paxos

7.小结

通过前面的讨论和学习，我们可以回顾一下协议的细节：

为什么要被大多数接受？因为两个多数派必有交集，所以一般是奇数个(2n+1)Acceptors，然后允许最多n个Acceptors宕机，而保证算法仍然可以正常运行，最终得到一个确定的chosen值。
为什么需要做一个承诺？首先，可以保证第二阶段A的Proposer的选择不受未来某个值的影响(因为对方已经给出了承诺)；其次，对于每一个Acceptors而言，承诺决定了它回应提议编号较大的Prepare请求，和接受提议编号较小的Accept请求的先后顺序。
为什么第二阶段A要从返回的提议编号中选取最大的一个？这样选出来的提议编号一定不小于已经被多数派接受的提议编号，进而可以保证该提议编号对应的那个值是chosen的那个值。

“与其预测未来，不如限制未来”,应该是Paxos协议的核心思想。——郑建军(微信工程师)

参考资料

Leslie Lanmport:Paxos Made Simple

Info架构师2017年1月刊:微信PaxsoStore:深入浅出Paxos算法协议

一步一步理解Paxos算法