重複博弈是一種特殊的博弈。在博弈中,相同結構的博弈重複多次,甚至無限次。我們知道,在單個的囚徒困境博弈中,雙方采取對抗的策略可使個人收益最大化。假設甲、乙兩人進行博弈,甲、乙均采取合作態度,雙方的收益均為50元;甲合作、乙對抗,則甲的收益為0,乙的收益為100元;乙合作、甲對抗,則甲的收益為100元,乙的收益為0;甲、乙兩人均對抗,則雙方收益均為10元。由此我們可以看到,如果雙方都合作,每個人都將得到50元,而如果雙方都對抗,則各自隻能得到10元。那麼人們為什麼還會選擇對抗而不是合作呢?原因就在於這是一個一次性博弈的囚徒困境——既然無論對方選擇什麼,選擇對抗都是我們的最優策略,那麼隻要我們稍微理性一點,就會自然選擇對抗。
如果就一次性博弈來說,對抗是必然的結果。但是,如果甲、乙具有長期關係(比如他們是生意上的長期合作者),那麼情況則有所改觀。因為我們可以作如下推理:如果雙方一直對抗,那麼大家每次都隻能獲得10元的收益,而如果合作,則每次都可得到50元。最重要的是,假定甲選擇合作而乙選擇對抗,那麼乙雖然在這一次可以多得到50元(100-50),但從此甲不會再與他合作,乙就將會損失以後所有能得到50元的機會。因此從長遠利益來看,選擇對抗對雙方而言並不聰明,合作反而是兩人最好的選擇。
這也真實地反映了日常生活中人們合作與對抗的關係。比方說,在公共汽車上,兩個陌生人會為一個座位爭吵,因為他們彼此知道,這是一次性博弈,吵過了誰也不會再見到誰,因此誰也不肯吃虧;可如果他們相互認識,就會相互謙讓,因為他們知道,兩者以後還會有碰麵甚至交往的可能。兩個朋友因為什麼事情發生了爭吵,如果不想徹底決裂,通常都會在爭吵中留有餘地,因為兩人日後還要重複博弈。
10策略博弈:亮出手中的優勢牌
按照博弈論的觀點,各方均有一個優勢策略的博弈是最簡單的一種博弈。雖然其中存在策略互動,卻有一個可以預見的結局:全體參與者都會選擇自己的優勢策略,完全不必理會其他人會怎麼做。
但並不是所有博弈都有優勢策略,哪怕這個博弈隻有一個參與者。實際上,優勢與其說是一種規律,不如說是一種例外。雖然出現一個優勢策略可以大大簡化行動的規則,但這些規則卻並不適用於大多數現實生活中的博弈。這時候我們必須用到其他原理。
一個優勢策略優於其他任何策略,同樣,一個劣勢策略則劣於其他任何策略。假如我們有一個優勢策略,應該選擇采用,並且知道對手若是有一個優勢策略他也會照辦;同樣,假如我們有一個劣勢策略,我們應該避免采用,並且知道對手若是有一個劣勢策略他也會規避。
假如我們隻有兩個策略可以選擇,其中一個是劣勢策略,那麼另一個一定是優勢策略。因此,與選擇優勢策略做法完全不同的規避劣勢策略做法,必須建立在至少一方擁有至少兩個策略的博弈的基礎之上。在沒有優勢策略的情況下,我們要做的就是剔除所有劣勢策略,不予考慮,如此一步一步做下去。
假如在這麼做的過程當中,在較小的博弈裏出現了優勢策略,應該一步一步挑選出來。假如這個過程以一個獨一無二的結果告終,那就意味著你找到了參與者的行動指南以及這個博弈的結果。即便這個過程不會以一個獨一無二的結果告終,它也會縮小整個博弈的規模,降低博弈的複雜程度。
利用優勢策略方法與劣勢策略方法進行簡化之後,整個博弈的複雜度已經降到最低程度,不能繼續簡化,而我們也不得不麵對循環推理的問題。我們的最佳策略要以對手的最佳策略為基礎,反過來從對手的角度分析也是一樣。
11髒臉博弈:以人推己的最佳策略
有甲、乙、丙三個人,他們每個人的臉都是髒的。設定沒有一個人有鏡子,且不許相互告知信息,因此每個人隻能夠看到別人的臉是髒的,但無法知道自己的臉是否是髒的。如果三人之外的A告訴他們:“你們三人的臉至少有一人是髒的。”因為三個人中的任何一個人都知道另外兩個人的臉是髒的,因此充其量隻是把事實重複了一遍而已。這看似一句廢話,然而它卻是具有信號傳遞作用的關鍵信息,它使三個人之間擁有共同信息成為可能。假定三個人都具有一定的邏輯分析能力,那麼至少將有一人能夠確切地知道自己的臉是否是髒的。