從防守的角度看,猜硬幣的博弈是可以有簡單的辦法讓對方猜不出自己的選擇的,就是隨機的選擇出正麵和反麵,同時正反兩麵出現的概率應該相同。如果出幣方雖然是隨機的選擇出正麵和反麵,但是總體上出正麵多於出反麵,則猜的一方還是有機可乘,隻要猜的一方也以正麵多於反麵的概率出擊,則長時間下來,一定是贏多輸少。反之,猜幣方也是一樣。
從博弈理論看,這個博弈可分為三類:第一,存在某種策略使一方肯定贏;第二,存在某種策略使得某一方可以肯定不輸;第三,既不存在一方肯定勝的辦法,也不存在一方肯定不輸的辦法。猜硬幣博弈屬於第二類,存在不輸的方法。由此也可以推論,該博弈中不存在任何保證能贏的方法,因為這與存在不輸的方法是矛盾的。
博弈的雙方如果有任何一方采取了這種策略,則其防守完全嚴密,對方將討不到任何便宜。不管對方采取什麼辦法,多次重複博弈的結果隻能是接近於平局。對於一個零和博弈,平局本來就是兩分的結果。但是,采取隨機策略的代價是在不輸的同時也完全放棄了贏的機會,即使對方以非常明顯的規律出,結果仍然是平局,自己固然沒有留下任何漏洞給對方利用,但也失去了從對方的漏洞中得到好處的機會。
所以,這個博弈有個有趣的性質,即博弈雙方都可以單方麵地采取行動把競局結果固定在平局,對方再怎麼努力也是惘然,這種性質是博弈規則所決定的。
如果博弈的雙方都不滿足於一個平局的結果,那麼可以采取一種策略:先隨機出正反麵,維持一個平局的局麵,同時盡量從對方的出幣中尋找規律,當捕捉到這種規律時就利用它。這有些像守在堡壘後麵,觀察敵人動態,敵人一旦出現破綻就伺機進攻,所謂“以靜製動”,“先求不可勝,以待敵之可勝”。
但是如果雙方都采取這種保守策略,博弈將永遠維持在平衡狀態,必須有一方首先走出堡壘,按某種規律出幣,誘使對方也走出堡壘,這時才能開始一場真正的鬥智。在前麵的分析中,我們知道先走出堡壘的一方隻是打破了平衡,其實並沒有什麼損失。這時的局麵是一方攻一方守,攻的一方其實是表麵上的防守方,因為是他在努力發現對手出幣的規律性,而設規律的一方則在誘使對方走出堡壘來捕捉自己的規律,在捕捉自己規律的同時他的出幣就也帶有規律了。
如果雙方都是理性的人,而且也知道對方也是理性人,則誘敵一方知道,自己一旦走出某種規律就立刻被進攻方發現,進攻方也知道自己一旦走出堡壘也會被對方發現。結果誘敵方的規律一旦走成就不再成立,因為如果繼續下去則進攻的一方就會利用這一規律;反之,攻的一方發現對方走出了規律也不能總是去利用,因為如果有了發現規律立刻利用的規律,則對方也可利用你了。最終結果還是隨機出幣,雖然這時雙方在主觀上已經不是把自己當成抽簽機器了,但記錄其結果和隨機出幣應該是沒有什麼差別的,最多不是純隨機,而是幾種模式隨機切換,這種有結構的隨機已經足以形成平衡局麵了。
但是,如果博弈雙方不是理性人,比如是一個聰明人和一個弱智人,弱智人的出幣中可能存在規律或偏好,可以利用這一點贏他。即便他的出幣中開始沒有規律,也可以故意按規律出幣誘他上當,開始由於他反應比較慢,可需要多出幾次才能讓他發現,這一過程叫訓練,若是對理性人,這麼幹已經很危險了。由於弱智人反應遲鈍,所以一旦發現規律就可能習慣性的按這個規律去出,而意識不到自己已經陷於危險了,這時,聰明人就可以贏他了。
所以,現實博弈與理想博弈的區別在於現實博弈的出幣中有更多的規律性,不論是固有的偏好,或者在訓練階段和利用階段,都會形成規律性的出幣。至於規律的簡單程度和持續的時間則決定於博弈參與者中弱智一方的智力,他的智力越高,則規律越複雜,持續時間越短,極限情況就是博弈雙方都是理性人,博弈中的規律少到根本無法利用。
在博弈中尋找均衡點
說起博弈的平衡點,不能不提一部名叫《美麗心靈》的電影。它是由美國環球公司於2001年拍攝出品的,可謂家喻戶曉。該片一舉囊括了第59屆金球獎5項大獎,並榮獲2002年第74屆奧斯卡獎4項大獎。影片本身與銀幕背後的人物原型,都深深震撼了全世界人們的心靈。《美麗心靈》藝術地再現了數學天才、1994年諾貝爾經濟學獎得主之一、罹患妄想型精神分裂症三十多年又奇跡般恢複正常的約翰·納什傳奇般的人生經曆。
1950年和1951年納什的兩篇關於非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈及其均衡解,並證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經濟均衡的內在聯係。納什的研究奠定了現代非合作博弈論的基石,後來的博弈論研究基本上都沿著這條主線展開的。然而,納什天才的發現卻遭到馮·諾伊曼的斷然否定,在此之前他還受到愛因斯坦的冷遇。但是骨子裏挑戰權威、藐視權威的本性,使納什堅持了自己的觀點,終成一代大師。
納什是一個非常了不起的數學家,他的主要貢獻是1950至1951年在普林斯頓讀博士學位時做出的。然而,他的天才發現———非合作博弈的均衡,即“納什均衡”並不是一帆風順的,其中艱苦也許隻有納什本人可以深深地體會到。
那麼究竟什麼是“納什均衡”呢?
納什均衡是指一個不會令人後悔的結果,無論其他人怎樣做,各方對於自己的策略都很滿意。在納什均衡中,你不一定滿意其他人的策略,但你的策略是應對對手策略的最優策略。納什均衡中的各方決不會合作,而且總是認定自己無法改變對手的行動。
以圍棋為例。從博弈角度來看,圍棋初段到九段的差別隻是他們策略選擇技巧的高低不同而已。比如過分的“騙招”、“本手”與“緩招”之間,一般都會選“本手”。招法過分如不遇反擊,可能占到便宜,如遇反擊則可能虧損,因此如果棋力相當,應考慮到對手的反擊手段。對手也會考慮到在追求利益過程中不可能占盡便宜。這就是雙方都能接受的方案。如果一方的策略是搶占實地,另一方是獲得外勢,而結果相當互有所得,雙方就願意那樣下。搶占實地獲得現實利益,獲得外勢考慮將來發展,這便形成一個雙方的“均衡”;另一方麵可以從具體行棋效果來看,如果一步棋能考慮到對手各種應手而依然成立,對手也用同樣法則找到應對,則可以說雙方達成“均衡”。
納什均衡的思想其實並不複雜,在博弈達到納什均衡時,局中的每一個參與者都不可能因為單方麵改變自己的策略而增加獲益。於是雙方為了自己利益的最大化而選擇了某種最優策略,並與對手達成一種暫時的平衡。
然而,博弈的結果不能都成為均衡。因為圍棋本身就是一個零和博弈。博弈的均衡是穩定的則必然可以預測。納什均衡的另一層含義是:在對方策略確定的情況下,每個參與者的策略是最好的,此時沒有人願意先改變或主動改變自己的策略。
圍棋是對弈雙方按照一先一後次序行動的博弈。對於一人一步的相繼行動的博弈,每個參賽者都必須向前展望或預期,估計對手的意圖,從而倒後推理,決定自己這一步應該怎麼走。
這是一條線性的推理鏈:假如我這樣做,它就會那樣做——若是那樣,我會這樣反擊”,後麵的步驟依此類推。也就是說,你怎麼走棋,完全取決於對手的上一招,這在博弈中叫“倒推法”。
在圍棋博弈中,存在明顯的馬太效應,也就是說,凡是擁有較少的,連他僅有的那一點點也奪過來;凡是擁有較多的,就加給他,讓他擁有更多。比如“一招不慎,滿盤皆輸”的諺語,當然我們也要用馬太效應的原理,在獲得優勢的情況下能保持優勢,擴大優勢,直至最後成功。
在生活中一般出現的都是互不知道對方策略、同時進行的博弈,這種叫做靜態博弈。在這種博弈裏,沒有一個博弈者可以在自己行動之前知道另一個博弈者的整個計劃。在這種情況下,互動推理不是通過觀察對方的策略進行,而是必須通過看穿對手的策略才能展開。
要想做到這一點,單單假設自己處於對手的位置會怎麼做還不夠。即使你那樣做了,你隻會發現,你的對手也在做同樣的事情,即他也在假設自己處於你的位置會怎麼做。
因此,每一個人不得不同時擔任兩個角色,一個是你自己,一個是對手,從而找出雙方的最佳行動方式。與線性推理鏈的推理不同,這是一個循環,即“假如我認為對方認為我認為……”
這樣看來,定式是一係列納什均衡的累計直至局部達到穩定的一種變化,直到一方認為可以根據形勢選擇任何變化或脫身而無局部受損之虞。由於定式是在大量實戰基礎上不斷被驗證並長期積累而成。因此在博弈中,納什均衡的要義在於:即使在對抗的條件下,雙方可以通過向對方提出威脅和要求,找到雙方能夠接受的解決方案而不至於因為各自追求自我利益而無法達到妥協,甚至兩敗俱傷。穩定的均衡點建立在找到各自的“占優策略”,即無論對方作何選擇,這一策略始終應優於其他策略。
為了進一步說明納什均衡的意義,讓我們看一個例子。
小李與小玲正在熱戀之中。可是有一天他們因為一件小事鬧得不太開心。這是因為北京時間2008年6月30日晚上,第13屆歐洲杯足球決賽將在維也納恩斯特·哈佩爾球場打響。小李是個超級球迷,他連國內的甲級聯賽都不肯放過,更何況是這樣四年一屆的精彩賽事呢?恰好這天晚上,小玲的妹妹要來,小玲準備去火車站接站,她也不放心讓她妹妹獨自來訪。問題在於,小李和小玲正處於熱戀之中,整天如膠似漆,讓他們各自為政,分別去做自己的事情是他們都不願意得到的結果。如此一來,他們就麵臨一場溫情籠罩下的“博弈”。在情侶博弈中,雙方都沒有嚴格優勢策略和嚴格劣勢策略。
我們不妨這樣給小李和小玲的“滿意程度”賦值:如果小李在家看球而小玲一個人去接妹妹,雙方的滿意程度都為“0”;兩人一起去看足球,小李的滿意程度為“2”,小玲的滿意程度為“1”;兩人一起去接妹妹,小李的滿意程度為“1”,小玲的滿意程度為“2”;應該不會有小李獨自看球而小玲獨自去接妹妹的可能,不過人們還是把它寫出來,設想此時雙方的滿意程度都是“0”。現在,接妹妹不是小李的劣勢策略,因為如果小玲堅持去接妹妹,接妹妹小李卻還可得“1”,而選足球卻隻能得“0”;選足球當然更不是小李的劣勢策略。所以,小李沒有嚴格的劣勢策略。同樣,小玲也沒有嚴格的劣勢策略。這樣,嚴格劣勢策略消去法就沒有用武之地了。但是,他們總會做出一個較好的選擇,因為他們是熱戀中的情侶。在情侶博弈中,雙方都去看足球或者雙方都去接妹妹,就是我們所說的相對優勢策略的組合:一旦處於這樣的位置,雙方都不想單獨改變策略,因為單獨改變沒有好處。準確地說,是單獨改變不會帶來額外的好處。比如說,如果小李單獨去看足球,得到“0”,沒有好處;如果小玲單獨去接妹妹,也沒有好處。所以,兩人一起去看足球或是接妹妹都是穩定的結局。
納什均衡是博弈論中一個重量級的概念,它主要描述雙方博弈的這樣一種對局形勢:任何一方單獨改變策略,都不會得到好處。所以,也可以說納什均衡狀態是市場力量相互作用的穩定結局。
這個生活化的例子可以更直白淺顯地把納什均衡講清楚。納什均衡可以簡單地做如下定義,在一策略組合中,所有的參與者麵臨這樣的一種情況:當其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他單獨改變策略,他的收益將會降低。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的衝動。
在博弈中納什均衡點如果有兩個或兩個以上,結果就難以預料。這對每個博弈方都是麻煩事,因為後果難料,行動也往往進退兩難。生活中的簡單案例能說明深刻的道理。在我們普通的生活中大量充斥著充滿博弈思維的事情,當遇到存在兩個或兩個以上納什均衡點的博弈局勢時,如果你是個有心人,懂得運用博弈思維去分析的話,局麵對於你就不會是進退兩難了。
信息決定博弈的勝敗
根據參與者對博弈局麵的了解程度可以把博弈分為信息完美博弈和信息不完美博弈。如果在博弈進行過程中,每個參與方都可以得知其他各方都進行了哪些操作,目前處於什麼狀態,則稱為信息完美博弈。如下棋,雙方對盤麵上的局勢一目了然,博弈過程的信息是完全透明的,這是典型的信息完美博弈。但也有一些博弈在進行過程中各方並不完全了解其他各方的選擇,其他各方的狀態對他是不透明的,如各種牌類,從橋牌到麻將,各方都不知道別人手裏是什麼牌,這就是信息不完美博弈。社會生活中存在大量信息不完美博弈的例子,最典型的如軍事對抗,敵對雙方都盡量隱蔽自己的意圖,秘密地調動部隊,以期給對手以突如其來的一擊。指揮員必須在對手情況不明了的情況下製定作戰計劃,這一決策過程是一種典型的信息不完美博弈。
最能體現信息不完美博弈特點的是博弈中的試探和發信號現象。這在信息完美博弈中是不存在的。在信息不完美的情況下,博弈方常常處於一種無從決策的狀態,因為對方可能處於任何狀態,使得自己無法計算出哪一招是最好的。所以,發信號和試探就成為博弈獲勝的關鍵。
比如,在軍事上,有時在正式進攻之前,常常要做試探性的進攻,借以偵察敵方陣地的對手情況,為正式進攻做準備。在牌類遊戲中,有時也有為了試探別家牌力而打牌的情況。
更高級的是博弈中的發信號現象。在多方博弈中,為了溝通信息,博弈方之間可能形成一些信號,這類操作從直接的得益計算角度是不能理解的,隻有了解了信號的規則才能看懂。比如,在橋牌中的叫牌,本來這是決定打牌的目標位和由誰來打的一步,但實際上叫牌更重要的作用在於溝通信息,橋牌中的叫牌體係就是利用叫牌交流信息的方法。
在分析博弈狀態時,由於沒有直接清晰的信息源,所以,常常要根據很多蛛絲馬跡的線索一點一點地縮小可能的範圍,而且常常是無法完全明確的。
比如,在打牌的過程中,可以根據對手的出牌分析他們各自手中可能有的牌,比如有人打出一張7,則可以判斷他有另一張7的可能不大,因為人一般不會拆開雙張。這種分析隻能得到一些線索,知道對手可能有什麼牌的可能性大,而一般不能明確的偵知對手整把牌的情況。能夠根據信息明確的判斷當前對手所處的狀態當然最好,但更一般的情況是,偵察到的信息不夠明確,隻能幫我們確定,幾種可能情況出現的概率不同,某些情況的可能性大而另一些情況的可能性小。這種情況又該如何處理呢?
當不能確定對方到底處於什麼狀態時,則在確定自己的每一種策略的得分時,隻有做最壞的考慮,設想對手可能處於對自己最不利的位置。如果知道對手處於某一種狀態的可能性大,處於另一種狀態的可能性小,則可以根據概率計算出每一招的綜合成績,據此決定選擇哪一招。
所以,信息不完美博弈的第一個問題是怎樣對博弈的態勢進行正確的判斷,這包括兩個方麵。第一,怎樣獲取更多的信息;第二,怎樣利用這些信息判斷博弈態勢。
這裏再以打牌為例,如果記得過去都出過什麼牌,就可以知道現在每門花色每個牌點還各有哪幾張牌,由此可以知道自己手中的牌力,決定該如何做;再如知道某人上一輪已經沒有某一門牌了,則也可幫助決定現在該打哪張牌。這種計算是在利用遊戲規則所提供的計算依據,結論是必然性的。根據某人的操作可以從另一個角度推斷他的狀態。比如在打麻將時,某人打出一張六萬,則可以據此推斷,他手中沒有另一張六萬,也不會有四萬和五萬,或五萬和七萬,或七萬和八萬,因為那樣他就得破牌了。麻將高手都是很善於從牌麵上推斷這類信息的,麻將牌藝的高低也主要體現在這種分析水平上。