正文 第一章:生活無處不博弈——看似繁雜其實簡單的遊戲(1 / 3)

博弈可以說是無處不在的,人們的工作和生活就是一個不斷決策的博弈過程。我們每天都必須做出各種各樣的決策,在這些決策中,存在一個共同的因素,那就是我們並不是一個人在一個毫無幹擾的真空世界裏作決定,我們的身邊充滿了同樣的決策者,他們的選擇與我們的選擇相互作用,選擇的結果也相互影響。了解博弈思想和博弈策略,能夠讓我們更客觀地審視自己的得與失,在正確的時間裏作出正確的選擇。

著名經濟學家保羅·薩繆爾森說:“要想在現代社會做一個有文化的人,你必須對博弈論有一個大致了解。”其實,所謂 “博弈”就是指可以分出勝負的遊戲,也就是雙方或多方在競局中為爭奪利益所采取的策略。

迪克西特和奈爾伯夫在《策略思維》一書中,講述了這樣一個有趣的故事:

有兩個大學生選修了一位博弈論教授的課程。這兩個學生平時的成績很好,總是得“A”。轉眼到了期末,考試前一個周末正是緊張複習的時候,這兩個學生卻到外地去參加另一所大學舉行的舞會。他們本打算周日早晨一早就趕回學校,這樣就可以利用周日下午的時間來準備第二天的考試。但是,由於玩得太盡興,結果周日那天他們睡過了頭。當他們匆匆返回學校的時候,已經到了晚上,所以肯定來不及準備第二天的考試了。於是他們打電話給教授撒謊說他們趕回學校時乘坐的汽車的輪胎爆了,因此一直被耽誤在路上沒有時間複習功課,希望可以獲準緩一天參加考試。

對教授而言,如果這兩個學生說的是事實,他的確想體諒他們並允許他們緩考。但如果這兩個學生僅僅是在撒謊,那麼他顯然應該拒絕他們不合理的要求,並讓他們為自己的行為付出代價。但問題是,教授並不知道這兩個學生的緩考理由是真是假,那他該怎麼辦呢?教授仔細思考後答應了這兩個學生的緩考請求。

這兩個學生很高興,他們抓緊當天晚上和第二天上午的時間認真複習,作好了應對考試的一切準備。考試開始以後,他們被分別安排在兩個不同的考場裏,並很快拿到了試卷。試卷一共有兩頁,第一頁上是一個非常簡單的題目,他們輕鬆地做完了,並暗自慶幸教授還真是照顧自己。等翻到第二頁的時候,他們傻眼了——上麵隻有一道考題,題目是:爆胎的是哪個車輪?

在故事中,這位教授就麵臨一個難題,即要不要相信學生的話。如果隻是出於直覺而不相信學生的話,那麼就是對學生的不尊重,但如果相信了學生說的話,但他們其實是在撒謊,那對其他學生來說就是不公平的。而問題的關鍵在於,教授無法去實地驗證學生的話。那教授該怎麼辦呢?這時,聰明的教授就運用了博弈思維去解決這個問題。他把兩個學生分開放在兩個不同的考場裏,這樣他們就無法串供。在這樣的情況下,如果兩個學生的答案是一致的,就說明他們說的多半是真話,如果他們的答案是不一致的,就說明他們說的多半是謊話。在這個故事中,博弈思維得到了淋漓盡致的運用。

其實,所謂 “博弈”就是指可以分出勝負的遊戲,也就是雙方或多方在競局中為爭奪利益所采取的策略。隻要參賽者講究博弈策略,排陣有方,本來較弱或比較被動的一方就有可能打敗較強或比較主動的一方,取得最後的勝利。就像上述故事中處境被動的教授就是通過一個巧妙的計策來驗證了學生的話。

博弈可以說是無處不在的,我們的工作和生活就是永不停息的博弈決策過程,小至決定早餐要吃什麼,晚上要不要到超市瘋狂采購一番,要不要看場電影、散散步、買部車、把菜吃完,或是讀哪一本書,大至報考什麼學校、選擇什麼專業、從事什麼樣的工作、怎樣開展一項研究、如何打理生意、該和誰合作、做不做兼職、要不要辭掉工作、要不要競爭總裁的職位,甚至是要不要結婚、什麼時候結婚、該和誰結婚、要不要孩子、怎樣將孩子撫養成人等,不管有意無意,一時衝動還是深思熟慮,你都在進行著做還是不做、怎樣去做的選擇,而這個過程裏就充滿著博弈思維。

在這些各不相同的決策中,存在一個共同的因素,那就是你並不是一個人在戰鬥,更不是在一個毫無幹擾的真空世界裏戰鬥。相反,你的身邊有很多同樣的決策者,他們的選擇既被你的選擇所影響,也影響著你的選擇。就像小說《魯濱遜漂流記中》魯濱遜一個人淪落荒島的時候,做與不做、做什麼都是他自己說了算;可是“星期五”(魯濱遜的仆人)出現了以後,他就要麵對博弈問題了。

博弈論是由20世紀中期的兩位傑出的學者——馮·諾伊曼和摩根斯坦創立的。從專業的角度來說,博弈論就是“研究決策主體的行為在直接相互作用時,人們如何進行決策以及這種決策如何達到均衡的問題”。

為了解釋和理解不同主體之間博弈決策的相互影響,我們不妨設想一下石匠作決策和拳擊手作決策時所參考因素的差異是什麼。石匠在開鑿石頭的時候,他的“對象”常常是被動的,沒有什麼思維能力,不會對他采取合作或對抗策略。然而,拳擊手在攻擊對方要害的時候,他的每一步計劃都會招致對方的抵抗,而且他還會被對方主動地攻擊,他必須設法消除或戰勝這些抵抗和攻擊。

所以,在人與人的博弈中,你必須意識到,你的博弈對象都是聰明而有主見的人,他們關心自己的利益,而不會被動挨打。他們既會有與你的目標發生衝突的可能,也會有與你合作的可能。在你作決定的時候,你應該首先設法消除他們的對抗意識,然後積極與對方進行不同程度的合作,以使雙方都能從這種合作中得到最大的利益。

為了能夠作出更有利於自身的選擇,也為了能夠與他人更好地合作,你需要學習一點博弈論的策略思維。正是因為如此,著名經濟學家保羅·薩繆爾森說:“要想在現代社會做一個有文化的人,你必須對博弈論有一個大致了解。”

蹺蹺板上的你和我:納什均衡

所謂納什均衡,就是指在一策略組合中,所有的參與者麵臨這樣的一種情況:當其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他單獨改變策略,他的收益將會降低。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的衝動。

要解釋納什均衡,就要從2001年拍攝出品的一部名叫《美麗心靈》的電影說起。《美麗心靈》是由美國環球公司拍攝的一部家喻戶曉的電影,該片一共獲得了第59屆金球獎5項大獎,並榮獲2002年第74屆奧斯卡獎4項大獎。影片本身與銀幕背後的人物原型,都深深震撼了全世界人們的心。《美麗心靈》藝術地再現了數學天才、1994年諾貝爾經濟學獎得主之一、罹患妄想型精神分裂症30多年又奇跡般恢複正常的約翰·納什的傳奇般的人生經曆。

納什是一位非常了不起的數學家,他於1950年至1951年在普林斯頓讀博士學位時作出了巨大的貢獻,他的天才發現——非合作博弈的均衡便是其中之一。

1950年和1951年納什發表了兩篇關於非合作博弈論的重要論文,從此徹底改變了人們對競爭和市場的看法。在這兩篇論文中,納什證明了非合作博弈及其均衡解,並證明了均衡解的存在性,即著名的納什均衡,從而揭示了博弈均衡與經濟均衡的內在聯係。

那麼究竟什麼是“納什均衡”呢?

所謂納什均衡是指一個不會令人後悔的結果,無論其他人采取什麼策略,博弈各方對於自己的策略都很滿意。即使在對抗的條件下,雙方也可以通過向對方提出威脅和要求,找到雙方都能夠接受的解決方案而不至於因為各自追求自我利益而無法達成妥協,甚至兩敗俱傷。更重要的是,在納什均衡中,無論對方作何選擇,每一個參與者所選擇的策略始終應優於其他策略。在納什均衡中,博弈參與者不一定滿意其他人的策略,但他們的策略卻是應對對手策略的最優策略。納什均衡中的參與者彼此之間絕不會合作,因為他們認定了自己無法改變對手的行動。圍棋就是一個極好的例子。

從博弈的角度來看,圍棋初段與九段的差別隻是棋手選擇策略的技巧水平高低有所不同而已。比如棋手過分的“騙招”、“本手”與“緩招”之間,一般都會選“本手”。由於招法過分如不遇反擊,棋手可能占到便宜,但如果遇到反擊則可能虧損,因此如果雙方的棋力相當,棋手會考慮到對手的反擊手段。當然,對手也會考慮到這些因素。在這種情況下,選擇“本手”就是雙方都能接受的方案。如果一方搶占實地,另一方獲得外勢,而結果相當,互有所得,雙方就願意繼續這樣做。搶占實地獲得現實利益,獲得外勢考慮將來發展,這便形成一個雙方的“均衡”;另一方麵可以從具體行棋效果來看,如果一步棋能考慮到對手各種應手而依然成立,對手也用同樣法則找到應對,則可以說雙方達成“均衡”。如果其中任何一方都隻想獨霸所有利益,那麼該博弈就無法進行下去,雙方也就無法從中獲得自己想要的樂趣。

從這個分析的過程中,我們也可以引申出納什均衡中的這樣一個悖論:從利己目的出發結果損人不利己。從這個意義上說,納什均衡還告訴我們這樣一條真理:合作是有利的“利己策略”。但博弈各方要達成合作,就必須符合以下黃金律:如果你想讓別人怎樣對你,你就要先這樣對別人,但前提條件是他們也按同樣方式行事。一旦有人單獨改變策略,那麼他將不會得到好處。

小吳與女友正在熱戀之中,可是有一天他們因為一件小事鬧得不太開心。這是因為北京時間2008年6月30日晚上,第13屆歐洲杯足球決賽將在維也納恩斯特·哈佩爾球場進行。小吳是個超級球迷,他連國內的甲級聯賽都不肯放過,更何況是這樣四年一屆的精彩賽事呢?恰好這天晚上,女友的妹妹要來,女友準備去火車站接站,她不放心讓她妹妹獨自來訪。問題在於,小吳和女友正處於熱戀之中,整天如膠似漆,讓他們“各自為政”、分別去做自己的事情是他們都不願意得到的結果。如此一來,他們就麵臨一場籠罩在溫情下的“博弈”。在情侶博弈中,雙方都沒有嚴格優勢策略和嚴格劣勢策略。

我們不妨這樣給小吳和女友的“滿意程度”賦值:如果小吳在家看球而女友一個人去接妹妹,雙方的滿意程度都為“0”;如果兩人一起去看足球,小吳的滿意程度為“2”,女友的滿意程度為“1”;如果兩人一起去接妹妹,小吳的滿意程度為“1”,女友的滿意程度為“2”。現在我們就會發現,如果女友堅持去接妹妹,小吳也一起去的話,他還可得“1”,但如果他選足球的話卻隻能得“0”,可見接妹妹不是小吳的劣勢選擇,而選足球也不是小吳的劣勢策略。所以,小吳沒有嚴格的劣勢策略。同樣,女友也沒有嚴格的劣勢策略。這樣,此時的嚴格劣勢策略消去法就毫無用處。但是,作為一對熱戀中的情侶,他們總會作出一個較好的選擇。在這樣的情況下,事實上他們的最佳選擇就是都去看足球或者都去接妹妹,而這種選擇恰恰就是相對優勢策略的組合:一旦處於這樣的位置,雙方都不會想單獨改變策略,因為單獨改變沒有額外的好處。比如,如果小吳單獨去看足球,收益為“0”,顯然是沒有好處的;如果女友單獨去接妹妹,她也沒有好處。所以,兩人一起去看足球或是接妹妹都是合理的結局。

這個生活化的例子可以更直白淺顯地把納什均衡講清楚。從這個例子出發,我們也可以將納什均衡做如下定義——在一策略組合中,所有的參與者麵臨這樣的一種情況:當其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他單獨改變策略,他的收益將會降低。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的衝動。

當然,如果在博弈中有兩個或兩個以上的納什均衡點,結果就難以預料。這對每個博弈方都是麻煩事,因為後果難料,行動也往往進退兩難。

生活中的簡單案例能說明深刻的道理。在我們普通的生活中大量存在著充滿博弈思維的事情,當遇到存在兩個或兩個以上納什均衡點的博弈局勢時,如果你是個有心人,懂得運用博弈思維去分析的話,那麼局麵對於你就不會是進退兩難了。

黑貓與白貓:博弈的競爭本質

無論怎樣分類,無論是什麼博弈,其直接目的都是為了競爭,其次才是在競爭的基礎上尋求共同點,以獲得最大的利益。

博弈在不同的狀態下有不同的表現形式,我們可以簡單地看一下博弈的不同分類法。

一般來說,博弈可以分為合作博弈與非合作博弈。它們之間的區別主要在於相互發生作用的當事人之間有沒有一個具有約束力的協議。如果博弈參與者在行動時從自身的利益出發能與其他參與者達成某種有約束力的契約或默契,以選擇共同的策略,那麼這種博弈就是合作博弈。如果參與者彼此之間無法達成有約束力的協議,那麼這種博弈就是非合作博弈。比如,企業之間聯合定價的行為就屬於合作博弈,而挑起價格戰的行為便是非合作博弈。

合作博弈與非合作博弈之間並不是完全不相容的,合作博弈中往往包含著非合作博弈的因素,如石油輸出國組織(OPEC)的建立就是合作博弈的產物,但各參與者之間為了保護各自利益而做出的超產和爭吵行為又屬於非合作博弈。

非合作博弈研究人們在利益相互影響的局勢中如何選擇策略以使自己的利益達到最大化。比如,A、B兩家企業合作建設一條汽車的生產線,協議由A方提供生產汽車的技術,B方提供廠房和設備。在對技術和設備進行資產評估時就會形成非合作博弈,因為每一方都試圖最大化己方的評估值。這時B方如果能夠獲得A方關於技術的真實估價或參考報價這類競爭情報,就可以使自己在評估中獲得優勢;同理,A方也是一樣。至於自己的資產評估是否會影響到合作企業的總體運行效益這樣的“集體利益”,則不會非常重視。這就是非合作博弈,參與人在選擇自己的行動時,優先考慮的是如何維護自己的利益。

目前經濟學家所說的博弈論一般是非合作博弈,由於相對比較簡單,它的成熟度要比合作博弈高。

按照雙方在博弈中的收益,博弈可以分為零和博弈與非零和博弈。所謂零和博弈就是指所有博弈方的得益總和為零的博弈,賭博就屬於零和博弈。例如三個人參加一場賭博,其中兩個人總共輸了2000元,那麼另外一個人必然贏了2000元。期貨交易市場上的參與者之間的關係也是零和博弈。人們平常所說的“損人利己”實際上也包含零和博弈的意思。