书城励志一本书看懂博弈论
2686300000003

第3章 认识博弈论(2)

这就是公共品供给的囚徒困境:如果大家都只考虑到自己的得失,只打自己的小九九,结果是谁也不付出,得过且过,也就排除了合作双赢的前景。所以,公共品问题一定要有人协调和管理,大家的事情要有专人进行协调管理。其实,这就是政府的主要职能之一。对于一个国家来说,最重要的公共品是国防公安、基础设施、科教文卫等。政府责无旁贷地要用来自纳税人的钱,把文化教育、基础设施和国防公安等属于大家的事情做好。

在修路博弈中,为了解决这条通往外界公路的修建问题,需要政府牵头,强制性地分别向上官、欧阳两家各征税2个单位,然后投入4个单位的成本修建好这条给两家都带来好处的公路。有句俗语不是说嘛“要想富,先修路。”路修好了,就可以使两户居民的生活水平在一定程度上得到很大的改善。通常也只有政府出面,大家才能走出谁都不愿意去修建公共设施的囚徒困境。当然了,羊毛出在羊身上,公民税收是必不可少的,因此大家都要承担自觉纳税的义务。

教授的圈套

“选A还是选B”这个问题不仅让富有实战经验的商人们苦恼不堪,它也同样折磨着商学院的天之骄子们。一位教授让自己班上的27名学生进行一个博弈游戏,这个博弈会把所有学生带入囚徒困境之中。

游戏规则如下:假设每一个学生都是一家企业的老板,现在他必须决定自己应该选择A——代表着生产高质量的商品来维持较高价格,还是选择B——代表着生产假货以通过别人所失来换取自己所得。游戏规定学生选择A可奖励2元,选择B可奖励2.15元。但选择A将产生总体收益:1个学生选择A,总体收益为2元;2个学生选择A,总体收益是4(2×2=4)元,依此类推……选择B将无总体收益可言。同时,将选择A的学生所产生的总体收益的总金额平均分给所有学生。

这是一个教授事先设计好的博弈,以确保每个选择B的学生总比选择A的学生多得0.15元。这个假定也有其现实意义,因为生产质次的假货所付出的成本总比生产高质量的商品要低,反过来,其利润当然要高。

但是,选择B的人数越多,就意味着选择A的人数越少,则他们的总体收益就会越少,总体收益越少,平均分到每个人手中的收益就越少。这个假设也有道理:随着市场上充斥着的假货的增多,消费者便会逐步地认清它们的面目,就会理性地不再购买它们,这就直接导致了假货生产者利润的减少(游戏中指选择B的学生)。并且,市场上出现的假货太多,市场秩序就会混乱,该产品的信誉就会降低,这也直接降低了高质量产品生产者的利益(游戏中指选择A的学生)。

假设27名学生都选择A,那么他们每人各得2元,且总体收益是54(2×27=54)元,将54元平均分配给27个学生,也是每人2(54÷27=2)元,则每个学生最后的实际所得为4(2+2=4)元。

假设有1个学生有了自私自利的打算,偷偷改变主意,选择B,那么,选择A的学生就有26名,每人各得2元,总体收益是52元(2×26=52),将52元平均分配给全班27个学生,每人各分得1.9(52÷27≈1.9)元,则选择A的学生最后的实际所得为3.9(2+1.9=3.9)元,比原来少得0.1元;而选择B的那个学生最后可得4.05(2.15+1.9=4.05)元,比原来多了0.05元。

假设有2个学生改变主意,改选B,则有25名学生选择A,每人各得2元,总体收益是50(2×25=50)元,将50元平均分配给27个学生,每人可分得1.85(50÷27≈1.85)元,则选择A的25名学生最后每人各得3.85(2+1.85=3.85)元;而选择B的那2个学生最后每人各得4(2.15+1.85=4)元。

假设有3个学生改选B,那么,选择A的学生就有24名,每人各得2元,总体收益是48(2×24=48)元,将48元平均分配给全班27个学生,每人可分得1.78(48÷27≈1.78)元,则选择A的学生每人各得3.78(2+1.78=3.78)元;而选择B的3个学生每人各得3.93(2.15+1.78=3.93)元。

……

假设全班27个学生为了尽可能使自己的收益达到最大,一致选择自私的策略,统统选择B,则总体收益是0元,最后每个学生各得2.15元。由以上分析可以看出,当只有1个学生选择B的时候,该学生能获得最大收益4.05元,其余26名学生相对会蒙受一点损失,只能获得3.9元。反过来,如果他们进行合作,协同行动,不惜将个人的收益减至最小,都选择A,则每个人都能获得最大收益4元。选择B的学生人数越多,每个人的总体收益越少。

演练这个博弈的时候,起初每个学生都被相互隔离开,不允许讨论,单独做选择。结果全班27名学生无疑都像囚徒困境中的嫌疑犯一样,都是聪明绝顶的理性人,各个精于算计,为了多获得0.05元,不约而同地都选择了B。

后来教授允许学生之间相互讨论,以便达成共识。结果同意合作而选择A的学生总数从3人到14人不等。在最后的一次带有约束性协议的博弈里,只有4个学生愿意选择A。此时,全体学生的总收益是65.45[2×4+2.15×(27-4)+2×4=65.45]元,比全体学生成功合作可以得到的总收益108(2×27+2×27=108)元减少了42.55(108-65.45=42.55)元。

这个游戏也可以看作是非合作博弈的又一典型模式,并且比囚徒困境更深刻地揭示了人自私自利的本性。这一模式代表了这样一种情况——处于相同困境状态下,各方都不知道别人的选择,因而只能猜测每个人都是绝对的理性人,最后必将背叛其他人,从自己的利益出发,做出最有利于自己的选择。

处于困境中的人们与困境之间是一种不可逆转的关系,也就是说当他们无法通过自己的力量去左右局势,获得集体收益最大时,就只能在困境的局势下想办法尽可能让自己的损失最小,收益最大。

这个游戏在现实社会中也极具代表性。比如,某村有一块公共草地可供牧人放牧,每个牧民都清楚地知道增加自己养羊的数目,可以增加收入。但由于是共属大家的公共草地,没有人会去关心草地的承载极限,于是羊越来越多、草越来越少,最后草地空了,草没了,羊也没了,这是一个带有悲剧性的博弈过程。当出现类似情况的时候,就需要有外界力量对其进行干预,制定相应规则,从而使草地得到最大限度的利用,大家才能真正得到实惠。

你和上司永远差一步

企业老板为促使员工之间互相竞争,努力工作,有时会故意在员工之间形成囚徒困境的局面。为了形成这种激励员工卖力工作的囚徒困境,老板可以采取这一策略:奖励表现最优秀的员工,并淘汰表现未达工作标准的员工。假如员工都接受了这场博弈,那么他们就可能会兢兢业业地工作了。

假设某公司开发出一种新产品,并招聘了20个业务员来对它进行推销,此时作为公司老板的你,要如何决定每个业务员的工作量呢?由于这种产品过去在市场上从来没有出现过,所以你根本无法评估能干又勤奋的业务员每个月到底能卖多少。

唯一解决的办法就是根据相对绩效标准来评估每个业务员的表现,也就是拿他们的工作业绩进行相互比较,给予销售量高的业务员以额外的奖励。此时,相对绩效评估标准将会使所有业务员陷入积极工作的囚徒困境之中。

以甲、乙两个业务员之间的博弈为例,甲、乙都可以选择每月工作20天或25天。虽然由于此项工作本身的特殊性,跑外的业务员不比坐办公室上班的员工,老板无法准确判断业务员的实际工作时间,但是他们也不是全然就没有了管束,老板可以根据每月月底各个业务员的销售成绩,对他们这个月的工作状况进行逐一考核。一般情况下,每月工作25天的业务员所推销出的产品会比每月工作20天的业务员要多。

对公司而言,只要两个业务员的工作时间一样,就会得到相同的评价。在这种情况下,两个业务员若要得到相同的评价,很可能会选择集体偷懒,因为每个人都偷懒时,大家的表现就会不相上下,显然会选择每月工作20天,而不会选择每月工作25天。当然,两个业务员都会失去成为业务精英的机会,但放弃这个机会而换取舒适的工作环境也许很值得。

不过,老板针对此种情况而设计的囚徒困境却迫使他们不得不延长工作时间。假如甲每月工作20天,乙工作25天,乙就会得到优等的评价,获得奖励;要是甲每月工作25天,但乙每月只工作20天,那么乙将会受到老板的批评,饭碗可能就保不住了。所以对甲、乙来说,每月工作25天是他们的最佳选择。

虽然员工们都想轻松度日,在工作中偷懒,但当公司老板以相对评估标准来衡量员工工作业绩时,囚徒困境的产生就使得某一员工很难说服别人一起偷懒。退一步想,假如员工互相串通,集体偷懒,相对标准所形成的囚徒困境遭到瓦解,老板要怎么做才能激励员工努力工作呢?此时,你就必须采取客观的绩效评估标准,把表现不佳的人毫不留情地开除。

签订合作协议——由婚姻想到的

严格的囚徒困境形成的前提条件是参与博弈的各方不可以进行合作,不能够制定有约束力的合作协议。但是在实际生活中,相互合作是社会文明的基础,这已得到先哲们的认可,哲学家卢梭不就写了《社会契约论》一书嘛,他就肯定地认为契约是整个人类社会存在的前提条件之一。联系到生活实际,兴修水利、组织国防、创建企业等不都是因合作而产生的吗?

当然,我们现在所说的以签订协议的方式来破解囚徒困境是存在一定的限定条件的,即博弈必须重复若干次,至少大于一次。对于一次性博弈而言,签订协议是毫无意义的。

何谓重复博弈、一次性博弈?

以恋爱博弈为例,重复博弈是指男女双方在长期交往的过程中,随时都在进行着的博弈,因为相爱的过程中任何一个时点都是有可能分手的。无数爱情故事中的悲欢离合、精彩跌宕正是重复博弈模型的表现。而那种素不相识的男女,偶尔在酒吧中相遇,于是宾馆订房、玩乐一场,拂晓之后就分道扬镳的一夜情,就是典型的一次性博弈。