說起博弈的平衡點,不能不提一部名叫《美麗心靈》的電影。它是由美國環球公司於2001年拍攝出品的,可謂家喻戶曉。該片一舉囊括了第59屆金球獎5項大獎,並榮獲2002年第74屆奧斯卡獎4項大獎。影片本身與銀幕背後的人物原型,都深深震撼了全世界人們的心靈。《美麗心靈》藝術地再現了數學天才、1994年諾貝爾經濟學獎得主之一、罹患妄想型精神分裂症三十多年又奇跡般恢複正常的約翰·納什傳奇般的人生經曆。
1950年和1951年納什的兩篇關於非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈及其均衡解,並證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經濟均衡的內在聯係。納什的研究奠定了現代非合作博弈論的基石,後來的博弈論研究基本上都沿著這條主線展開的。然而,納什天才的發現卻遭到馮·諾伊曼的斷然否定,在此之前他還受到愛因斯坦的冷遇。但是骨子裏挑戰權威、藐視權威的本性,使納什堅持了自己的觀點,終成一代大師。
納什是一個非常了不起的數學家,他的主要貢獻是1950至1951年在普林斯頓讀博士學位時做出的。然而,他的天才發現———非合作博弈的均衡,即“納什均衡”並不是一帆風順的,其中艱苦也許隻有納什本人可以深深地體會到。
那麼究竟什麼是“納什均衡”呢?
納什均衡是指一個不會令人後悔的結果,無論其他人怎樣做,各方對於自己的策略都很滿意。在納什均衡中,你不一定滿意其他人的策略,但你的策略是應對對手策略的最優策略。納什均衡中的各方決不會合作,而且總是認定自己無法改變對手的行動。
以圍棋為例。從博弈角度來看,圍棋初段到九段的差別隻是他們策略選擇技巧的高低不同而已。比如過分的“騙招”、“本手”與“緩招”之間,一般都會選“本手”。招法過分如不遇反擊,可能占到便宜,如遇反擊則可能虧損,因此如果棋力相當,應考慮到對手的反擊手段。對手也會考慮到在追求利益過程中不可能占盡便宜。這就是雙方都能接受的方案。如果一方的策略是搶占實地,另一方是獲得外勢,而結果相當互有所得,雙方就願意那樣下。搶占實地獲得現實利益,獲得外勢考慮將來發展,這便形成一個雙方的“均衡”;另一方麵可以從具體行棋效果來看,如果一步棋能考慮到對手各種應手而依然成立,對手也用同樣法則找到應對,則可以說雙方達成“均衡”。
納什均衡的思想其實並不複雜,在博弈達到納什均衡時,局中的每一個參與者都不可能因為單方麵改變自己的策略而增加獲益。於是雙方為了自己利益的最大化而選擇了某種最優策略,並與對手達成一種暫時的平衡。
然而,博弈的結果不能都成為均衡。因為圍棋本身就是一個零和博弈。博弈的均衡是穩定的則必然可以預測。納什均衡的另一層含義是:在對方策略確定的情況下,每個參與者的策略是最好的,此時沒有人願意先改變或主動改變自己的策略。
圍棋是對弈雙方按照一先一後次序行動的博弈。對於一人一步的相繼行動的博弈,每個參賽者都必須向前展望或預期,估計對手的意圖,從而倒後推理,決定自己這一步應該怎麼走。
這是一條線性的推理鏈:假如我這樣做,它就會那樣做——若是那樣,我會這樣反擊,後麵的步驟依此類推。也就是說,你怎麼走棋,完全取決於對手的上一招,這在博弈中叫“倒推法”。
在圍棋博弈中,存在明顯的馬太效應,也就是說,凡是擁有較少的,連他僅有的那一點點也奪過來;凡是擁有較多的,就加給他,讓他擁有更多。比如“一招不慎,滿盤皆輸”的諺語,當然我們也要用馬太效應的原理,在獲得優勢的情況下能保持優勢,擴大優勢,直至最後成功。
在生活中一般出現的都是互不知道對方策略、同時進行的博弈,這種叫做靜態博弈。在這種博弈裏,沒有一個博弈者可以在自己行動之前知道另一個博弈者的整個計劃。在這種情況下,互動推理不是通過觀察對方的策略進行,而是必須通過看穿對手的策略才能展開。