藺相如連忙扶起廉頗,說:“咱們兩個人都是趙國的大臣,將軍能體諒我,我已經萬分感激了,怎麼還來給我賠禮呢。”
兩個人都激動得流下了眼淚,從這以後,兩人就做了知心朋友。
這就是負荊請罪的典故,可以說,這是一個典型的二人博弈的實例。
博弈一詞來源於中國古代,指下圍棋。直到二十世紀美國數學天才馮·諾伊創立了“最大最小定理”,才奠定了博弈論的第一塊基石。博弈論也稱為對策論,是一種數學方法,因為它經常用於分析並選擇在競爭環境下最適宜自己一方的策略,因而被廣泛地引入經濟學領域,成為經濟學的一個重要分支。
讓我們看這樣一個一對一博弈的故事:警察抓到兩個犯罪嫌疑人,劉剛和蘇生。警方對兩個人隔離審訊,開始兩個人都矢口否認自己的盜竊行為。警方向他們交代:如果主動坦白自己的罪行,隻判一年徒刑;如果拒不坦白自己的罪行,而被同夥檢舉出來,就要被判處十年徒刑;如果你們兩個都坦白自己的罪行,你們兩個都將被判五年徒刑。
劉剛和蘇生麵臨兩種選擇:抵賴或者坦白。
兩個處於隔離狀態的嫌疑人都擔心對方檢舉自己的罪行。這時,他們考慮最多的是自身利益的最大化,這是理性經濟人從利己目的出發的唯一選擇。所以兩個人都會有這樣一個思考過程:如果對方招了,我不招,他被判一年,我將被判十年;如果我招了,對方不招,我將被判一年,而他將被判十年;如果我招了,他也招了,也要比他招了,我不招的結果要好。所以兩個人都做出了對自己最有利的選擇——坦白。然而,他們兩個最終都麵臨著五年的監獄生涯。
這就是著名的“囚徒困境”。雖然兩個人都抵賴的結果是最好的,但是這是一種不可能的選擇,因為每一個人都不可能去冒險,因為他擔心對方坦白。這種結果在信息不對稱的情況下是唯一的選擇,沒有第二種選擇,所以人們將這種結果稱為非合作博弈均衡。非合作均衡是陷入僵局的一種均衡。雙方都采取不合作態度,人們首先想到的都是利己,但是最後不但沒有獲得利己的結果,而且還損害了對方的利益、整體的利益。
囚徒困境告訴人們:在給定他人戰略決策的情況下,所有參與博弈的各方沒有人再選擇其他戰略以使自己獲得更大的利益,從而沒有人希望打破目前的這種均衡狀態,這就是“納什均衡”。在“納什均衡”狀態下,人們都從自身角度考慮,選擇對自己最優的戰略決策,但是由這些最優戰略組合而成的決策卻不一定是一個總體最優的結果。也就是說,在納什均衡狀態下,參與博弈的各方都做出了“不合作”的選擇,而這種不合作使參與博弈的各方都因此受到傷害,大家都受到了損失;相反,如果參與博弈的人們選擇“合作”,雙方則會因此得到額外的收益。
藺相如和廉頗雖然沒有學過博弈學,但是他們卻是懂得合作的博弈者,他們不是消極地麵對眼前的困境,他們不做困境中的囚徒,而是積極地合作,擺脫眼前的困境,從困境中尋求置之死地而後生的對策、力量,獲得自由。
“囚徒困境”的故事還告訴人們,任何一種製度、事件要想得到一個大家都滿意的結果,就必須是一種“納什均衡”,用通俗一點的話說,所謂納什均衡就是一種“僵局”,在給定別人不動的情況下,沒有人有興趣動。大家都僵在那裏了,從而保證了一個相對穩定的局麵。如果一個製度安排或者一個事件的處理結果不是一個納什均衡,人們就會不斷地根據對方采取的某種措施而設計出一種應對的措施、對策……雙方在這種一來一去的無限報複中不斷升級,最終兩敗俱傷。
你想,如果麵對廉頗的所作所為,藺相如也針鋒相對和廉頗對著幹,結果會怎樣?你報複我,我再報複你,怨怨相報何時有個了斷?現在藺相如無論如何也不采取行動,在這種情況下,廉頗也沒有辦法,最後隻能也選擇了不動。這就是納什均衡。