书城励志博弈学(历代经典文丛)
2993500000002

第2章 博弈——历史中弱者的选择(1)

对博弈论稍有了解的人,都会知道“囚徒困境”这个名词,这是博弈论中一个基本的模型,也是“非合作性博弈”的典型模式。简言之,这一模式代表了处于相同困境状态下,不同的人面对同样的几种选择,最后必将背叛其他人,作出最利于自己的选择的一种情况。

“囚徒困境”包含了几个基本的预设前提:处于困境下,各方都不知道别人的选择,因而只能猜测;每个人都是理性的人,从自己的利益出发去作出选择;他们与困境之间,是一种不可逆转的关系,即他们无法通过自己的力量去左右局势,只能在困境的局势下想办法尽可能让自己的损失最小。

这就是一种弱者的选择。

当然,这只是一种博弈论的模型,具体到现实领域,没有哪个具体的事件是完全符合“囚徒困境”的模式的。但是,这种“弱者对损失最小化的选择”的基本精神却是存在的。

从“囚徒困境”的模式,我们也可以看到,在这个模式中,理性的人最后的选择都是“背叛”,不通过合作的方式与他人共同摆脱困境。而现实之中,背叛与合作是并存的,而且各方之间的信息也并非都是完全闭塞的。所以说,现实比理论更精彩,“囚徒困境”的理论模型固然高明,但现实中的事件则更发人深省。在具体的现实中,合作还是背叛,弱者的选择都不是固定的,不过尽可能减少损失,让自己得利,则是不变的原则。

生存是人生的大道理

“囚徒困境”在博弈论中是最基本的理论。指两个共同犯罪的犯罪嫌疑人同时被抓,他们都存在两种选择,要么坦白从宽,减轻处罚或无罪释放,要么抗拒抵赖,加重惩罚或因证据不足而释放。但囚徒选择哪一种好呢?这要从两名囚徒选择的条件和结果来分析。现在我们假定两名囚徒分别为甲和乙两人,如果甲选择抵赖,这里的结果就有两种,如果乙选择坦白,那么甲将被加重惩罚;如果乙也选择抵赖,那么他们两个都将因证据不足而被释放。很明显这需要他们两个人的通力合作。但通常警方会把两名囚徒羁押在不同的囚房里,使这种合作难以顺利进行而使得结果预测的不确定性加大,或者说增加了抵赖合作的风险性。如果基于人是自私的这一前提出发的话,那么甲乙两囚徒各自最好的选择就是坦白从宽,因为不管甲乙两人谁坦白,都将得到减轻惩罚的结果:如果甲坦白了,乙抵赖,甲将免于惩罚;如果乙也坦白了,那么罪名各担一半,从甲个人看来,也减轻了惩罚;而甲乙互换位置,结果依然是一样。因此,在博弈论中认为他们两者之间存在一个均衡点,即纳什均衡点,我们把它称为严格优势策略。

但我们从上面的分析也可以看出,这个均衡点是建立在两个囚徒非合作的基础上的,并且两者的非合作还可以获得一定的利益(从宽惩罚),如果没有从宽惩罚的这一利益条件,那么这个严格优势策略也就不复存在。此时,两个囚徒就很容易走向合作了。在我国历史上出现的“合纵”和“连横”的较量就充分地说明了这一点。

从当时的历史来看。秦国在商鞅变法之后,一跃成为七国中实力最强的国家。社会上从此出现一种从来没有过的长期紧张局面,旧传统的意识形态和政治知识都不能应付这个雷霆万钧的压力。于是以秦国为对象,产生了两种崭新的但也恰恰针锋相对的战略思想和外交政策:一是合纵对抗政策,即围堵政策,主张从北到南,各国缔结军事同盟,共同抵御秦国的侵略,秦国如对某一国发动侵略,即等于向所有的盟国侵略,各国同时出兵作战;另一是连横和解政策,即和平共存政策,主张从西到东,各国同时跟秦国签订友好条约,保持双边的和平关系。

当时,东方的齐国与秦国旗鼓相当,双方在不断兼并周围弱国、扩大势力范围的同时,诞生了“合纵”和“连横”两个中心——以齐国为中心的“合纵”和以秦国为中心的“连横”。这就是我国历史上所谓的“合纵”、“连横”的外交斗争。

这里的“合纵”、“连横”就如囚徒的“抵赖”和“坦白”一样。“合纵”就是指弱国联合起来,阻止强国进行兼并,这是弱国保存自己最理想的策略。就如两个囚徒同时抵赖可以使两人都因证据不足而免于惩罚一样的理想结果,但条件是他们必须同时抵赖即能够合作。而“合纵”的对象有多个,就更需要多方面的合作了。虽然这种合作是可以看得见的,可以协商的,不像两个囚徒那样是在黑暗中猜测。但结果却很有相似之处。因为它成员多,而可变的人为因素也就更多了。“连横”就是强国迫使弱国帮助它进行兼并。正如两个囚徒的“坦白”,是他们单个的严格优势策略,但结果仍然是要得到惩罚一样,只不过这个惩罚是由一个人来担当还是由两个人来担当。而“连横”也是一样,它也是各个弱国的严格优势策略,但就整个共同体来看,弱国仍然会被兼并,只不过是被早兼并还是迟兼并的问题。其博弈矩阵如下:

从上面的矩阵我们可以看出,“连横”是秦国的严格优势策略,不仅可以得到土地这个现实的收益值,而且获得了统一中国这个未来的收益值。而“合纵”是齐国的严格优势策略,它不仅保存齐国已有的现实利益,还可以限制或削弱秦国的实力,使自己得以长存。

从实际上看。“合纵”和“连横”都是争取暂时同盟者的外交手段,其目的是进一步兼并土地,扩张领土。从博弈论看来,就是强国和弱国都在进行博弈,都在进行严格优势策略的博弈。而博弈的有序进行是必须基于一定的利益条件的,是根据利益条件这只看不见的手来进行调节的。这也就决定了“合纵”和“连横”的离散聚合了。

“合纵”和“连横”有其存在的历史必然性,同时也离不开这两幕历史剧的导演人——战国时的文人说客,其中最重要的就是苏秦和张仪。苏秦在研究社会局势和各国君主的心理后,提出对秦国采取合纵对抗政策。苏秦先后到了韩国、魏国、齐国,最后再到楚国。六国完全同意签署这个盟约,并一致任命苏秦为他们的宰相,让他担任“纵约长”——南北合纵对抗盟约组织的秘书长,围堵政策完成,第一次“合纵”形成。

这里苏秦的成功,在博弈论看来,其实就是两个在困境中的囚徒合作的成功,只不过这里的囚徒不是一个,而是六个,但成功的条件却是一样的,要使两个囚徒一起抵赖,就必须使两个囚徒坚信,抵赖是他们惟一的出路,是他们最大的利益;而要六国“合纵”,也是一样,必须使六国坚信“合纵”是它们惟一的出路,是它们最大的利益。站在当时六国的角度来看这是完全正确的。

只有大政治家才能看到十年之后,只有历史学家才能看到三十年之后。各国有各国眼皮底下的现实利益,而人往往更相信眼前直接的现实利益。这就是“严格优势策略”的特点。

秦国利用各国统治者的人性弱点,给以小恩小惠,然后各个击破,所以说,秦国在政治博弈中明显要比六国胜出一筹,因此,“合纵”也只能是昙花一现了。

在苏秦组成第一个“合纵”联盟的同时,秦国立即采取行动。就在“合纵”的第二年,即公元前332年,秦国向魏国表示让步,愿把从前侵占魏国的襄陵(山西襄汾)地区七个城市归还。那七个城市距魏国前首府安邑(山西夏县)一百六十里,是防务上最重要的屏障,如果能把它们收回。安邑就可以无忧了。

这是最大的现实利益,在博弈论看来,秦国是抛出了使人选择“严格优势策略”的利用条件,秦国成了“囚徒困境”中的警察。人有自私的本能,所以永远都有倾向于“严格优势策略”的自然选择,这可能也是人的生存本能。魏国自然不能抵抗这个诱惑,因为它更有利于魏国的生存,于是同意脱离合纵;而且为了扩张土地,魏国还向赵国发动攻击。齐国在秦国的鼓励下,认为可以从赵国瓜分到土地,就也参加到魏国这一边。两国军队虽然被赵国击退,但第一次合纵对抗盟约只维持一年便告瓦解,苏秦在赵国无法解释魏齐两国的叛盟行动。只好前往燕国,出任燕国宰相。秦国等到合纵对抗盟约瓦解了之后,却拒绝归还襄陵七城,魏国在大怒下攻击秦国,又被秦国击败。这样,第一次“合纵”就在六国的互相残杀中轰然瓦解。

合纵对抗盟约固然瓦解,但这种观念仍被认为是正确的指导原则。所以十五年后的公元前318年,这时各封国都已改制为独立王国,魏、楚、韩、赵、燕五个国家痛恨秦国趁着盟约瓦解不断向东扩张,于是再次缔结第二次合纵对抗盟约,推举楚王华槐担任纵约长,集结五国联军,进攻秦王国东方边界重镇函谷关(河南灵宝东北)。这次虽然是以楚国为首,好像齐国没有参加,但此时却还存在另外一个联盟,就是齐楚联盟,这个联盟在第一次“合纵”失败后仍然存在,所以齐国并没有在五国背后插刀。

这是一次声势浩大的军事行动,人人都预料将爆发一场大战。可是,秦国守关大将樗里疾大开关门,出兵迎战。五国联军震于秦军的声威,竟面面相觑,谁都不敢先行攻击。从博弈规则看来。五国同心协力进攻就成了“囚徒”的抵赖,就整个团体而言,它们可能获得最好的结果,而撤退是它们的“严格优势策略”。从合作性博弈规则来看,五国结成了同盟,就已经是一种合作关系,达到了一个博弈均衡点,而在这个均衡状态中,参与者谁先改变支付,谁就会得到利益。因此,在僵持了几天之后,楚兵团因粮道被秦国切断,在惊恐中第一个撤退,但它的损失应该是最小的,因为它没有遭到追击,而其他五国军队在跟着仓皇拔营回国时,就很可能遭到秦国的追击,事实也是如此,最后一个撤退的损失最大。合纵对抗盟约又一次瓦解。

但“合纵”和“连横”的真正关键是楚国。或者说齐秦斗争的焦点在于争取楚国。因为楚国是南方的一个大国强国,楚国是领土最广大、人力最雄厚的大国,秦国不敢轻视它,尤其恐惧楚国跟齐国联合。在当时的条件下,秦国还没有实力来战胜齐楚两国的联盟。而强大的秦国对其他六国都是一个潜在的威胁,楚国在分析了各方面的情况后,与齐歃血为盟,结成了“合纵”的局面。正如我们前面所分析的,因为生存的利害关系,促使了博弈双方的两个“囚徒”走上了“抵赖”的合作之路,而出现这种结果条件就是两者利益完全捆绑,一荣俱荣,一损俱损。这是齐楚两国在客观理性上的分析而能够通过协商来进行合作的结果。

但这种联盟很明显有一个前提,那就是秦国是齐楚的共同敌人,而在国家关系上是没有永远的敌人和朋友的,所以一旦敌人转化为朋友,“合纵”这个联盟也就霎时崩溃。而在此时,“连横”高手张仪横空出世,他正是深诸此道的博弈高手,正是他上演了一幕“一人打败楚国”的神话。为了瓦解齐楚“合纵”联盟,张仪入楚并口头许愿,以归还楚国商於(在今河南淅川西南)六百里的地方为代价。楚怀王信以为真,就和齐国断交。这里张仪运用的正是“囚徒困境”中的“坦白”利益条件,使楚国陷于“严格优势策略”的选择当中。

但这种严格优势策略的选择是要付出代价的,如果说囚徒之间的坦白只是从此以后两个人的私人关系的终结(当然不是绝对的),那么,国与国在这种情况下是不可能在短时间内再进行合作了,齐楚“合纵”联盟瓦解。

这时,齐秦斗争趋于白热化。山东五国的“合纵”依然存在。公元前298年,齐、韩、魏、赵、中山五国联军攻入函谷关。秦国被迫退还韩、魏的一些地方,五国才退了兵。齐国成为关东各国的盟主。但这种同盟并不牢固,当利益条件再度改变时,山东五国的“合纵”也就不复存在了。公元前288年,秦昭王自称西帝,尊齐滑王为东帝,用远交近攻的策略拉拢齐国,破坏了关东的“合纵”联盟。

在战国这场“合纵”和“连横”的历史博弈中,秦国成了最终的“警察”,而其他六国则相继沦为了“囚徒”,这六个“囚徒”在各自的历史舞台上都进行了“严格优势策略”的选择,然而都没有逃脱灭亡的历史悲剧,正如博弈中“囚徒困境”中的囚徒不能逃脱惩罚一样。在历史的博弈中,国家眼前的利益和国家长远的利益永远是一个辩证的矛盾体,二者统一于国家的发展之中。当眼前利益跟长远利益一致时,它就促进国家的发展;当眼前利益和长远利益相悖时,就会阻碍国家的发展,甚至使国家走上灭亡。

“合纵”是六国的长存之道,也就是它们的长远利益。但它在当时是难以直接地显现出来;而“连横”是六国的暂存之道,但这种暂存之道却是不利于六国的长存之道,但这种利益是眼前可以看到的,而这种眼前利益正是博弈中的“严格优势策略”,能使国家暂时地很好生存,但这种生存不是长存,从这个意义上说,生存未必是硬道理。长存才是硬道理。由此看来,在“合纵”和“连横”这场历史的较量中,“连横”是取得了最终的胜利。“囚徒”分担了罪名,“警察”得到了最大的实惠。