博弈学与心理学

第12课 蜈蚣博弈:如何抉择你都想要的鱼和熊掌

字体:16+-

如果打人能给你带来快乐,你会选择打人吗。我想很多人会说不会。这正如他们所说,假如我今天打了或欺负了他,他日后可能会报复,这种担心报复的心理部分抵消了打人带来的快乐。这个答案至少表明,你不打人不是因为你不想打人,或是因为道德方面的原因,而是考虑到了日后可能会给你带来麻烦。同样,在博弈对局中,我们现在的决策也很大程度上取决于对将来结果的预测。

什么是蜈蚣博弈的悖论

下棋的时候,我们要走一步棋,都要先对未来几步做一下预测,然后再确定这一步走哪个位置为好。在人生中,也是如此,我们在尝试做一件事情的时候,都会对结果进行分析预测,然后根据可能的情况作出合理的选择。这种博弈论就叫做倒推法。

倒推法又叫蜈蚣博弈,是由罗森塞尔(Rosenthal)提出的。它是这样一个博弈:两个参与者A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为有限次,比如100次。假定这个博弈各自的支付给定如下:

全部合作

A B A …… A B (100,100)

全部背叛

(1,1)(0,3)(2,2)(99,99)(98,101)

现在的问题是:A、B是如何进行策略选择的?

这个博弈因形状像一只蜈蚣,而被命名为蜈蚣博弈。

这个博弈的奇特之处是:当A决策时,他考虑博弈的最后一步即第100步;B在“合作”和“背叛”之间作出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。但是,要经过第99步才到第100步,在99步,A考虑到B在100步时会选择“背叛”——此时A的收益是98,小于B合作时的100,那么在第99步时,他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去,最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1,远远小于大家都采取“合作”策略时的收益:A:100,B:100-99。

根据倒推法,结果是令人悲伤的。从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100。当然,A一开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看,一开始A应取不合作的策略。我们不禁要问:是倒推法错了,还是直觉错了?

这就是蜈蚣博弈的悖论。

什么是悖论?悖论(paradox)来源于希腊语,para意即“超越”,doxos的意思是“相信”。Paradox的意思是:本来可以相信的东西不能相信,而有的东西看起来不可信但是反而是正确的。悖论指由肯定它真,就推出它假,由肯定它假,就推出它真的一类命题。在历史上有许多悖论。如“阿基里斯赶不上乌龟”的芝诺悖论,“一个克里特人说‘所有克里特人都说谎’”的说谎者悖论,“一个理发师说:‘我给所有不给自己理发的人理发’”的理发师悖论或罗素悖论,等等。这些悖论在历史上对于逻辑和数学的发展起了巨大的作用。

对于蜈蚣悖论,许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过实验[目前通过实验验证集体的交互行为已成时尚,正如博弈论专家英国的宾莫(Ken Binmore)所言,诺贝尔奖也无疑在考虑这方面的先驱者],实验发现,不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略,从而走向合作。这种做法违反倒推法,但实际上双方这样做,要好于一开始A就采取不合作的策略。

倒推法似乎是不正确的。然而,我们会发现,即使双方开始能走向合作,即双方均采取合作策略,这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑,肯定在某一步采取不合作策略。倒推法肯定在某一步要起作用。只要倒推法在起作用,合作便不能进行下去。

这个悖论在现实中的对应情形是,参与者不会在开始时确定他的策略为“不合作”,但他难以确定在何处采取“不合作”策略。

巧用倒推法计算自己的收益

一、由海盗分金的故事说起

如果打人能给你带来快乐,你会选择打人吗。我想很多人会说不会。这正如他们所说,假如我今天打了或欺负了他,他日后可能会报复,这种担心报复的心理部分抵消了打人带来的快乐。这个答案至少表明,你不打人不是因为你不想打人,或是因为道德方面的原因,而是考虑到了日后可能会给你带来麻烦。同样,在博弈对局中,我们现在的决策也很大程度上取决于对将来结果的预测。

有这样一个故事,船上有若干个海盗,要分抢来的若干枚金币。自然,这样的问题他们是由投票来解决的。投票的规则如下:先由最凶残的海盗来提出分配方案,然后大家一人一票表决,如果有50%或以上的海盗同意这个方案,那么就以此方案分配,如果少于50%的海盗同意,那么这个提出方案的海盗就将被丢到海里去喂鱼,然后由剩下的海盗中最凶残的那个海盗提出方案,依次类推。

我们先要对海盗们作如下假设:

1,每个海盗的凶残性都不同,而且所有海盗都知道别人的凶残性,也就是说,每个海盗都知道自己和别人在这个方案中的位置。另外,每个海盗都是很聪明的人,都能非常理智地判断得失,从而作出选择。最后,海盗间私底下的交易是不存在的,因为海盗除了自己谁都不相信;

2,一枚金币是不能被分割的,不可以你半枚我半枚;

3,每个海盗当然不愿意自己被丢到海里去喂鱼,这是最重要的;

4,每个海盗当然希望自己能得到尽可能多的金币;

5,每个海盗都是功利主义者,如果在一个方案中他得到了1枚金币,而下一个方案中,他有两种可能,一种得到许多金币,一种得不到金币,他会同意目前这个方案,而不会有侥幸心理;

6,最后,每个海盗都很喜欢其他海盗被丢到海里喂鱼。在不损害个人利益的前提下,他会尽可能投票让同伴去喂鱼。

现在,如果有10个海盗要分100枚金币,结果将会怎样呢?

要解决“海盗分金”问题,我们总是从最后的情形向前推,这样我们就知道在最后这一步中什么是好的和坏的策略。然后运用最后一步的结果,得到倒数第二步应该作策略选择,依次类推。要是直接从第一步入手解决问题,我们就很容易因这样的问题而陷入思维僵局:“要是我作这样的决定,下面一个海盗会怎么做?”

以这个思路,先考虑只有2个海盗的情况(所有其他的海盗都已经被丢到海里去喂鱼了)。不妨记他们为P1和P2,其中P2比较凶残。P2的最佳方案当然是:他自己得100枚金币,P1得0枚。投票时他自己的一票就足够50%了。

往前推一步。现在加一个更凶猛的海盗P3。P1知道———P3知道他知道———如果P3的方案被否决了,游戏就会只由P1和P2来继续,而P1就一枚金币也得不到。所以P3知道,只要给P1一枚金币,P1就会同意他的方案(当然,如果不给P1一枚金币,P1反正什么也得不到,宁可投票让P3去喂鱼)。所以P3的最佳策略是:P1得1枚,P2什么也得不到,P3得99枚。

P4的情况差不多。他只要得两票就可以了,给P2一枚金币就可以让他投票赞同这个方案,因为在接下来P3的方案中P2什么也得不到。P5也是相同的推理方法只不过他要说服他的两个同伴,于是他给每一个在P4方案中什么也得不到的P1和P3一枚金币,自己留下98枚。

依次类推,最终P10的最佳方案是:他自己得96枚,给每一个在P9方案中什么也得不到的P2、P4、P6和P8一枚金币。

结果,“海盗分金”最后的结果是P1、P2、P3、P4、P5、P6、P7、P8、P9、P10各可以获得0、1、0、1、0、1、0、1、0、96枚金币。

在“海盗分金”中,任何“分配者”想让自己的方案获得通过的关键是,事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。

真的是难以置信。P10看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还获得了最大收益。而P1,看起来最安全,没有死亡的威胁,甚至还能坐收渔翁之利,但却因不得不看别人脸色行事,结果连一小杯羹都无法分到,却只能够保住性命而已。

其实什么事情都是先手比较有优先决断权。历朝历代的农民起义、争斗不休的宫廷政变、企业内部成帮结派的明争暗斗、办公室脚下使绊的公司政治,哪一个得胜者不是用“强盗分金”的办法,他们都是以最小的代价获得最大的受益,拉拢“挑战者”分配方案中最不得意的人们,而打击“挑战者”。

当老大是不容易的,企业家就是要把各方面“摆平”。任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚 “挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。

为什么革命者总是找穷苦人?因为他们是最失意的人。为什么企业中的一把手,在搞内部人控制时,经常是抛开二号人物,而与会计和出纳们打得火热?这正是因为公司里的小人物好收买,而二号人物却总是野心勃勃地想着取而代之。

海盗P10就相当于公司老板。假如你作为老板,拥有最先分配权,就看你是否仁厚或是黑心,你有权独吞所有共同成果,也可以合理分配让大家满意,如果你过于贪婪,就要承担被伙伴“仍下海”的风险,如果您不想冒险,就放弃部分利益以求共存。

当然“海盗分金”的隐含假设是所有海盗的价值取向都是一致的,理性的。而在现实生活背景下,海盗的价值取向并不都一样,有些人的脾性是宁可同归于尽都不让你独占便宜,有些人则只求安稳,不计较利益。

所以这10个海盗换成不同性格的人在不同的位置都有可能影响结果。作为海盗P10,还必须对伙伴们的性格了如指掌,根据其性格特点和价值观作深入研究和策略分析,才能因地制宜,设计出最合适的分配方案,这是没有什么公式套路的。

和老板领导管理团队一样,要赚取最大化的利润又不能使自己的平台不至于垮掉,就必须对自己的下级做深入研究,制订相应合理的分配方案,才能获得最大的成功。

在“海盗分金”博弈中,我们还能看到一个富有哲学意义的命题。那就是生命与金钱孰重孰轻?

这在博弈中是一目了然的。没命的话要钱还有何用?所以首先是考虑自身的安全,当你身上只要还有一枚金币,别的海盗们就会贪图你这一枚金币,怎么办?除非什么都不要,剩下100枚金币让其他9个人平分。如果其他海盗都愿意以最小的代价(即9人内部不愿意再发生争执)换来最大的利益的话,这个方案就没有问题,但遗憾的是自己的利益就彻底丧失。

二、用倒推法看现实中的“私奔”问题

阿华在一家建筑工地当泥水工,这个工地被一个叫王锋的包工头包了下来,阿华这帮建筑工人就是在王锋手下干活,工钱也在王锋手上结算。由于王锋是个小包头,他手上的钱也不够用,为了节约成本,他让老婆帮工地的工人做饭,然后叫女儿王梅送往工地。王梅天生丽质,身材高挑,特别是他那双水汪汪的大眼睛,让人总觉得有点含情脉脉的味道。工地里以结过婚的人居多,独阿华还是一个毛头小子,高考落榜后就来到了王锋的工地。阿华见王梅人长得漂亮,时时的在吃饭的时候找王梅说话。王梅与阿年龄相仿,两人之间还算有共同语言,时间长了,王梅对阿华也有了好感。他见阿华虽在工地干活,但文学修养还是很高的,看过很多文学书,高中还在地方报上发表了不少文章,更重要的是他很有志向。用阿华的话来说,他来工地干活,主要是想以后不再花父母的钱。在工地赚了钱后,他打算用这钱来学电脑。学成后,他想做个网络编辑。

日子长了,两人爱慕,并打算结婚。但这这门亲事却遭到了王包头的极力反对。他认为女儿再没出息,也不能嫁一个既没钱又没发展前途的泥水工。这简直是门不当户不对,以他们家的实力和女儿的长相至少也要找一个“有工作”的人。但女儿就是一根筋,说什么非阿华不嫁。王锋见状,又叫一算亲友对王梅进行劝说,说了其中的利害关系,说什么你不要冲动,婚姻是一辈子的事,你跟阿华走,只能跟他一辈子受苦受累,等等说了一大堆。可王梅就是不听。王锋见这也不行,于是就使出了撒手锏,威胁说,你要是跟阿华结婚,我就和你断绝父女关系,以后家里再也不支持你了,让你跟那穷小子去受穷。

现在王梅应该如何选择?是屈从父亲还是跟心上人结婚?

王梅先选择与阿华断绝关系或者结婚,若与阿断绝关系,则她失去了一个心爱的人,得到-1的赢利(他父亲则得到赢利1,因为他终于如愿以偿让女儿没能给阿华结婚);若选择结婚,则由王梅的父亲做出反应,他可能真的断绝父女关系,在这中情况下,王梅得到0,因为她与爱人结婚得到1,失去父亲及家人支持得到-1,总计为0(姑且那么认为,有些当事人或会认为爱情比亲情的赢利大,或相反)。父亲得到-2(因为看到女儿和阿华结婚心中不快得-1,失去一个女儿其所得再增加-1);当然,既然生米煮成熟饭,父亲也可以默认,这时王梅既得到了爱人又没失去父亲故获得赢利为1,而父亲心中不快得到-1,但毕竟没有失去女儿。

使用倒推法不难得出,第二阶段父亲将选择默认(因为默认的赢利为-1,而断绝父女关系的赢利为-2);给定第二阶段父亲会默认,第一阶段王梅将选择结婚(结婚赢利为1,与阿华断绝关系赢利为—1)。所以私奔的纳什均衡是,王梅选择结婚,而王梅的父亲王锋选择默认。

我想现实中的私奔故事大抵如此,先是态度强硬不许结婚,后父亲无忍受失去女儿的痛苦,选择了默认。本故事的主人公也不例外,王梅与父母断绝关系后,和阿华去广东打工,后阿华当上了网络编辑,两口子生活还过得去,父亲也就慢慢地默认。现实的私奔的案例好像大多父亲都是输家。

这个案例也告诉我们,有些威胁并不可怕,因为它仅仅是威胁而已。就像父母反对女儿婚姻时常常摆出一副要断绝父女关系的样子,但一旦木已成舟,他们也只好默认,并不会真的与儿女断绝关系。学了博弈的人,更容易看出这些威胁是不可信的。

蜈蚣博弈的应用

一、最后通牒下的蜈蚣博弈

有这样一个故事:

两人分一笔总量固定的钱,比如说是100元。方法是:一人提出方案,另外一人表决。如果表决的人同意,那么就按提出的方案来分;如果不同意的话,两人将一无所得。比如A提出方案,B表决。如果A提出的方案是70∶30,即A得70元,B得30元。如果B接受,则A得70元,B得30元;如果B不同意,则两人将什么都得不到。

A提方案时要猜测B的反应,A会这样想:根据理性人的假定,A无论提出什么方案给B——除了将所有100元留给自己而一点不给B留这样极端的情况,B只有接受,因为B接受了还有所得,而不接受将一无所获——当然此时A也将一无所获。此时理性的A的方案可以是:留给B一点点比如1分钱,而将99.99元归为己有,即方案是:99.99∶0.01。B接受了还会有0.01元,而不接受,将什么也没有。

这是根据理性人的假定的结果,而实际则不是这个结果。英国博弈论专家宾莫做了实验,发现提方案者倾向于提50∶50,而接受者会倾向于:如果给他的少于30%,他将拒绝;多于30%,则不拒绝。

这个博弈反映的是“人是理性的”这样的假定在某些时候存在着与实际不符的情况。

理论的假定与实际不符的另外一个例子是“彩票问题”。

我们说理性的人是使自己的效益最大,如果在信息不完全的情况下则是使自己的期望效益最大。但是这难以解释现实中人们购买彩票的现象。

人们愿意掏少量的钱去买彩票,如买福利彩票、体育彩票等,以博取高额的回报。在这样的过程中,人们自己的选择理性发挥不出来,而唯有靠运气。在这个博弈中,人们要在决定购买彩票还是决定不买彩票之间进行选择,根据理性人的假定,选择不买彩票是理性的,而选择买彩票是不理性的。

彩票的命中率肯定低,并且命中率与命中所得相乘肯定低于购买的付出,因为彩票的发行者早已计算过了,他们通过发行彩票将获得高额回报,他们肯定赢。在这样的博弈中,彩票购买者是不理性的:他未使自己的期望效益最大。但在社会上有各种各样的彩票存在,也有大量的人来购买。可见,理性人的假定是不符合实际情况的。

当然我们可以给出这样一个解释:现实中人的理性的计算能力往往用在不符合实际情况的“高效用”问题上,而在“低效用”问题上,理性往往失去作用,对于人来说,存在着“低效用的区决策陷阱”。在购买彩票问题上,付出少量的金钱给购买者带来的损失不大,损失的效用几乎为零,而所能命中的期望也几乎是零,这时候,影响人抉择的是非理性的因素。比如,考虑到如果自己运气好的话,可以获得高回报,这样可以给自己带来更大的效用,等等。彩票发行者正是利用人存在着“低效用区的决策陷阱”而寻求保证赚钱的获利途径。

二、官场上的蜈蚣博弈

官场如战场,要想在官场上混得好,也必须懂得博弈。在我国古代,有些官员虽然不知道蜈蚣博弈这个概念,但却运用起来得非常精准,请看下面这个故事。

清朝有个叫张集馨的官员,曾任陕西粮道一职。张集馨的前任叫方用仪,为人贪婪,卸任前他的子侄和家人在大雁塔下的市场上买了四千石麦壳搀入东仓。这是一个很大的数目,如果用这批麦壳替换出小麦卖掉,用载重量三吨的卡车运,大概要装一百车,价值高达数十万人民币。按说,规模大了便难以掩人耳目,作弊也就不容易得逞——后任不肯替前任背这么大的黑锅,听到风声后通常会拒绝签字接手。但是与张集馨办理交接手续的不是方用仪本人,而是代理督粮道刘源灏。代理督粮道是公认的发财机会,如果刘源灏和方用仪办交接手续的时候拒绝签字,显然会失去这个好机会,于是他签了字,方用仪作弊得逞了。笔者估计方用仪所以敢如此大规模作弊,正因为他算透了刘源灏的心思。当时有一个流行比喻,叫做“署事如打抢”。署事就是代理的意思,连打带抢则是标准的短期行为特征。这个比喻所描绘的可以叫“署事潜规则”。

张集馨到任后访知此事,便拒绝从刘源灏那里接手签字。刘源灏苦苦劝说,说仓粮肯定没有其他方面的亏损短缺的问题,再说方用仪已经回了江西老家,还能上奏皇帝将他调回来处理此事吗?细品刘源灏说服张集馨的理由,其中包含了一个暗示:如果漏洞确实就这么几千两银子,为了等待方用仪回来重办交接,公文往来加上路途花费的时间恐怕需要好几个月,张集馨因等待而蒙受的物质损失恐怕还要超过这几千两银子。如果再算上得罪人的损失,算上在官场中不肯通融的名誉损失呢?换句话说,等待公事公办的代价太大,不值得,还是认账合算。张集馨果然被说服了,认了账。由此反推回去,方用仪离任前决定掺一百卡车麦壳,而不是五十卡车,也不是二百卡车,这分寸实在拿捏到了老谋深算的水平。

这个故事说明,官员也是博弈高手。方用仪之所以离任前掺一百卡车麦壳,而不是五十卡车,也不是二百卡车,是因为他早已算好张集馨为追查此案需要付出的成本。在这一百卡车的情况下,张集馨要追究此事则得不偿失,只好放弃;既然张集馨会放弃,那么刘源灏就会签字,既然刘源灏会签字,那他为什么不多为自己弄点好处呢?

三、爱情中的蜈蚣博弈

爱情就其本质来说是一种交往,人交往的目的在于个人效用(utility)最大化,不管这个效用是金钱,还是愉快的感觉、幸福的感觉。只要追求个人效用,就必定存在利益博弈,因而,我们的爱情交往是一个典型的双人动态博弈过程。爱情博弈不同于两人分蛋糕博弈,它的一个重要点是:爱情的效用随着交往程度的加深和时间推移有上升趋势.

假定阿花(女)和阿肥(男)是这个蜈蚣博弈的主角,这个博弈中他们每人都有两个战略选择,一是继续,一是甩。他们的博弈展开式如下:

???

阿花 —阿肥-……-阿花-阿肥-—阿花-阿肥-(10,10)

?|???? |?????????? |???? |???? ?|???? |

(1,1) (0,3)? (8,8) (7,10) (9,9) (8,10)

???

在图中,博弈从左到右进行,横向连杆代表继续交往战略,向下的连杆代表甩掉她(他)战略。每个人下面对应的括号代表相应的人甩了对方,爱情结束后,各自的爱情效用收益,括号内左边的数字代表阿花的收益,右边代表阿肥的收益。可以看到,阿肥和阿花甩战略对应的括号数字每个都不同,这是因为爱情效用在不断增加,这里假设爱情每继续一次总效用增加1,如第一个括号中总效用为1+1=2,第二个括号则为0+3=3,只是由于选择甩战略的人不同,而在两人之间进行分配。由于男女生理结构和现实因素不同,阿花甩战略只能使效用在二人之间平分,即两败俱伤,阿肥选择甩战略则能占到3个便宜。显然,甩战略对于被甩的一方来说是一种欺骗行为。

请看,首先,交往初期阿花如果甩了阿肥,则两人各得1的收益,阿花如果选择继续,则轮到阿肥选择,阿肥如果选择甩了阿花,则阿花属受骗,收益为0,阿肥占了便宜收益为3,这样完成一个阶段的博弈。可以看到每一轮交往之后,双方了解程度加深,两人爱情总效用在不断增长。这样一直博弈下去,直到最后两人都得到10的收益,为圆满爱情结局——总体效益最大。遗憾的是这个圆满结局很难达到!

大家注意,当阿肥到达甩了阿花可得收益是10的时候,他很难有动力继续交往下去,继续下去不但收益不会增长,而且有被阿花甩掉反而减少收益的风险。阿花则更不利,因为她从来就没有占先的机会,她无论哪次选择甩阿肥,二者都是两败俱伤,而且还有可能被阿肥欺骗减少收益的危险,在爱情过程中,女人总体来讲处于不利地位。因此,每一次交往,无论阿肥还是阿花都有选择甩来中止爱情的动机,更详细的数学可以证明,如果他们是极端个人主义的话,爱情圆满的结局不可能达到。个人效益最大与总体效益最大之间有矛盾。

怎样才能达到圆满结局呢?有三个因素决定,一是阿肥和阿花之间的爱情信念,即追求两个人的爱情效用最大,而不是单方面的,相信坚持下去会有好的结果;二是选择充分信任对方的行为,不要摆明了猜忌;三是最终结局的可能性,在博弈论中这个叫贴现因子,也就是未来的收益对于现在的收益来讲,哪个更大,比如对阿肥来讲,最终结局的收益10肯定不会等于当前甩了阿花得到的10,哪个更大,阿肥就选择哪个。两人对于爱情未来的观念和信念真的很重要。

蜈蚣博弈下的讨价技巧

一、约会的启示

有这样一对热恋中的情侣,不妨称为男A和女B,他们都是工作繁忙的公司主管,下班的时候他们约好去看电影。男A想看战争片,对艺术片毫无兴趣;女B则想看艺术片,对战争片没有一点兴致。不妨用定量地来分析,假设男A看战争片的满意程度为10分,而看艺术片的满意程度为2分;女B看艺术片的满意程度为10分,而看战争片的满意程度也为2分;两人在一起看电影满意程度各会提高10分。这个时候,我们可以得到如下的图。

20 12 2 2

10 10 12 20

很显然,男女都要么都去看战争片,要么都去看艺术片,这两种情况达到了该博弈的纳什均衡。这个博弈还有一个特征就是,每一个参与者都不存在优势策略,因为不管是男A或是女B,都会发现自己的最优策略取决于对方的选择。如果男A选择看战争片,那么女B选择看战争片的满意程度最高;如果男A选择看艺术片,那么女B选择看艺术片的满意程度最高。男A的策略选择亦然。另外,这个博弈的两个纳什均衡点都达到了帕累托最优的结局。当处在两个纳什均衡点时,如果男A或女B改变他们的策略选择,导致的结果是让双方都不满意。

如果时间紧迫,双方来不及联系并且事先也没有商量好,每个人只好单独决定自己去看什么电影。这个时候,很可能会出现的情况是男A去看战争片,女B去看艺术片,更糟糕的情况是,男A和女B都很尊重对方意见反而各自去看对方想看的而自己不想看的电影,这时的整体满意程度只有4分。很明显的,尽管情侣博弈中的两个纳什均衡都是有效率的,但这个博弈的不确定性却导致低效率的情况可能发生。

当然,这对恋人约会看电影事先打个电话,商量好再约定看什么,这比双方不进行沟通而私自决断要好得多。比方说,情侣双方可以随便定个规则,如双方商议,在看电影的前一天猜硬币,谁猜中了就听从谁的意见。说到猜硬币,笔者想到在历史上,曾经发生过堂堂一朝宰相录用官员竟然用抽签的方式去决定,这实在荒谬透顶。假如这对恋人都是非常较真的人,根本就不可能用猜硬币的方式,而是强行承诺,比如男A是个大男子主义者,直接告诉女B他是一定会选择战争片,完全不会去看艺术片,如果这个女主角B是个柔顺的小女人,结果当然仍是达到纳什均衡:双方都去看战争片。女B用威胁的手段亦然。

问题是,男A是大男子主义者,女B是女权主义者,双方都威胁对方不会去选择去看对方喜好的电影。这样的结果将达到次优,也就说无法达到帕累托最优的纳什均衡局面。好心办坏事,更糟糕的情况是,双方虽然在口头上严辞相对、威胁对方,但内心里反而是相互体谅对方,最后进行策略选择的时候反而都作出让步,各自选择了对方所爱看的电影。最终的结果很显然是效率最低的局面。

更进一步地分析这个问题,男女恋人任意一方在谈判(男女双方对片子选择的协商本质上就是一种讨价还价的谈判)中承诺要看什么电影,关键是其可信度取决于作出诺言的一方是否证明,除了遵守承诺以外,其他的选择并不是更痛苦。比如说,女B能够向她男朋友A证明:即使她一个人独自欣赏艺术片,也能津津有味地享受电影的乐趣,获得极大的满足感。这个时候,女B所作的一定要看艺术片的承诺就是可信的。

但是,假设男A正在追求女B,男A对女B的依赖性就会增强,他要考虑如何让女B开心来获得她的欢心。反过来说,男A向女B提出要求的能力自然就下降了。生活当中就是这样的道理,所谓“吃别人的嘴短,拿别人的手短”,不同的人在一起合作,有求于对方的人在讨价还价的谈判中一定是处于劣势的。

二、分蛋糕博弈下的先发优势及后发优势

为了更清楚地了解讨价还价的谈判,我们来看切蛋糕的故事。如果男女双方不是看电影,而是在切一块蛋糕,怎么才能保证分配的公平合理呢?很简单的一个方法,就是一方将蛋糕一切两半,另一方则选择自己分得哪一块蛋糕。不妨假设切蛋糕这种累活分配给男A,女B则在两块蛋糕中选择一块。很显然,男A在这种切蛋糕的规则下一定是努力让两块蛋糕切得尽量相同大小。然而在现实中,谁都不可能将两块蛋糕切得完全一样大,就算使用精密仪器去测量,用精密刀具去切割,这样做的成本太高,还不如用手去切。如果这个男A与其女朋友B都是个斤斤计较很小家子气的人,那么在这种规则下,男A分得的蛋糕一定是小的那块。

我们不妨假设,男A与女B都不愿意先去切这块蛋糕,于是又出现了另一种分配蛋糕的规则。不妨假设蛋糕总量为1,男A和女B各自同时报出自己希望得到的蛋糕的份额, 如4/5,8/9。他们之间约定,两人所报出的份额相加总和必须等于1,否则从新分配。从数学上可以得到,这个两人博弈的纳什均衡点会有无数个,只要两人所报出份额相加为1的组合都是均衡结局,比如男A报1/2,女B报1/2;男A报2/3,女B报1/3,依此类推。这里的问题是在于如果女B报8/9,男A报1/9,这个时候男A也只有接收这个条件,因为这是一次性博弈,如果男A不接收那么双方连一丁点的蛋糕都分不到,从理性人的角度来看这显然不存在的。

在实际生活中,除了绝对的利他主义者,或者带有其他目的的博弈参与者,显然8/9的蛋糕归某一参与者,剩余的部分仅仅1/9的蛋糕留给另一参与者的情况是很难发生。就这个例子来看,男A一定不满足于只能分到1/9的蛋糕,他一定要求再次分配。这种情况下,分蛋糕的博弈就不再是一次性博弈。

事实上,当分蛋糕博弈成为一个动态博弈时,这就形成一个讨价还价博弈的基本模型。在经济生活中,不管是日常的商品买卖还是到国际贸易乃至重大政治谈判,都存在着讨价还价的问题。比如中国加入WTO的时候,为了国家或民族利益与许多发达国家的讨价还价,进行了漫长而又艰难的谈判。我们从这个漫长过程的谈判中可以发现,讨价还价的过程实际上就是一个谈判的过程,比如发达国家首先对中国提出一个要求,中国决定是接受还是不接受,加入中国不接受,可以提出一个相反的建议,或者等待发达国家从新调整自己的要求。这样双方相继行动,轮流提出谈判要求,形成了一个多阶段的动态博弈。

我们先来看这样一个故事。在某个朝代有个破落贵族的后代A,穷困得实在没有办法过下去,不得不将家中主传的古字画拿到一个大财主B家去卖。这副字画在A看来至少值200两银子,财主B认为这副字画最多只值300两银子。这样看来,如果顺利成交,字画的成交价格将在200~300两银子之间。这个交易的过程不妨简化为这样:首先由B开价,A选择成交或还价。这个时候,如果B同意A的还价,交易顺利结束;如果B不接受,则交易结束,买卖没有做成。这是一个很简单的两阶段动态博弈的问题。

我们应该解决动态博弈问题的倒推法原理来分析这个讨价还价的过程。首先看第二轮也就是最后一轮的博弈,只要A的还价不超过300两银子,B都会选择接收还价条件。回过头来,我们再来看第一轮的博弈情况,A拒绝由B开出的任何低于300两银子的价格,这是很显然的,比如B开价290两银子购买字画,A在这一轮同意的话,只能卖得290两;如果A不接受这个价格反而在第二轮博弈提高到299两银子时,B仍然会购买这幅字画。两项比较,显然A会还价。

细心的读者可以发现,这个例子中的财主B先开价,破落贵族A后还价,结果卖方A可以获得最大收益,这正是一种后出价的“后发优势”。这一优势在这个例子中相当是分蛋糕动态博弈中最后提出条件的人几乎霸占整块蛋糕。

事实上,如果财主B懂得博弈论,他可以改变策略,要么后出价,要么是先出价但是不允许A讨价还价,如果一次性出价,A不答应,就坚决不会再继续谈判来购买A的字画。这个时候,只要B的出价略高于200两银子,A一定会将字画卖于B。因为200两银子已经超出了A的心里价位,一旦不成交,那一文钱也拿不到,只能继续受冻挨饿。

在博弈理论上,已经证明出,当谈判的多阶段博弈是单数阶段时,先开价者具有“先发优势”,而双数阶段时,后开价者具有“后动优势”。这在我们的生活中是非常常见的现象:非常急切想买到物品的买方往往要以高一些的价格购得所需之物;急切于推销的销售人员往往也是以较低的价格卖出自己所销售的商品。正是这样,富有购物经验的人买东西、逛商场时总是不紧不慢,即使内心非常想买下某种物品都不会在商场店员面前表现出来;而富有销售经验的店员们总是会劝说顾客,“这件衣服卖得很好,这是最后一件”之类的陈词滥调。