正文 第15章 警察與小偷博弈:沒有純策略均衡下的混合策略(2 / 3)

當每個博弈參與者都有優勢策略時,純策略均衡是非常合乎邏輯的。你有一個優勢策略,你可以采用;假如你有一個劣勢策略,你應該避免采用。

(第二節 誰來打電話

通常情況下,遭遇“警察與小偷”博弈時,雙方采取混合策略的目的是為了戰勝對方,是一種對立者之間的鬥智鬥勇。但實際上,你與別人合作的時候,也會發生混合性策略博弈。

如果甲正在和乙通話,突然電話斷了,而話還沒說完。這時每個人都有兩個選擇,馬上打給對方,或等待對方打來。注意:如果甲打過去,乙就應該等在電話旁,好把自家電話的線路空出來,如果乙也在打給甲,雙方都隻能聽到忙音;假如甲等待對方打電話,而乙也在等待,他們的聊天就沒有機會繼續下去了。

一方的最佳策略取決於另一方會采取什麼行動。這裏又有兩個均衡:一個是甲打電話,而乙等在一邊;另一個則是乙打電話,而甲等在一邊。

博弈論中有一個結論:納什均衡點如果有兩個或兩個以上,則結果難以預料。對於這個出現了兩個納什均衡點的打電話博弈,我們該如何從博弈論中求解呢?

事實上,博弈論在這個打電話問題上的解決辦法看起來很笨,即用投硬幣的方式來決定自己是不是應該給對方打電話。根據前麵給出的條件,兩人這種隨機行動的組合成為第三個均衡:如甲打算給乙打電話,有一半機會可以打通(因為這時乙恰巧在等甲打電話),還有一半機會發現電話占線;假如甲等乙打來電話,那麼,同樣會有一半機會接到電話,因為乙有一半機會主動給甲打電話。

由於雙方主動撥打電話的可能性為50%,所以平均來說要嚐試兩次才能成功接通。當然,這個“笨辦法”並不是博弈論的錯,而是就策略而言隻好如此。

博弈論對這種混合策略的傳統解釋是,局中人應用一種隨機方法來決定所選擇的策略。這種解釋在理論與實踐中均不能令人滿意。約翰·查裏斯·哈薩尼對此提出了更確切的解釋方法。

哈薩尼認為,在現實博弈中,每一種博弈的形勢都受到一些微小的隨機波動因素的影響。在標準的博弈模型中,這些影響表現為微小的、獨立連續隨機變量,每個局中人的每一個策略均對應一個隨機變量。這些隨機變量的具體數值僅為相關局中人所知,這種知識即成為私有信息;而聯合分布的則是博弈者的共有信息。哈薩尼把這稱為“變動收益博弈”。

在變動收益博弈中,各隨機變量的數值影響著每一個博弈者的收益。在適當的技術條件下,變動收益博弈所形成的純策略組合與對應無隨機影響的標準博弈的混合策略組合恰好一致。實驗證明,當隨機變量趨於零時,變動收益博弈的純策略均衡點轉化為對應無隨機影響的標準型博弈的混合策略均衡點。

變動收益博弈理論對混合策略均衡點提供了具有說服力的解釋:局中人隻是表麵上以混合策略進行博弈,但實際上仍是在各種略微不同的博弈情形中以純策略進行博弈。

所以,在生活中遇到這類問題時,我們隻能按照慣例或者隨機應變。一種解決方案是,原來打電話的一方再次負責打電話,而原來接電話的一方則繼續等待電話鈴響。這麼做有個顯而易見的理由:原來打電話的一方知道另一方的電話號碼,反過來卻未必是這樣。另一種可能性是,一方可以免費打電話,而另一方不可以(比如你是在辦公室,而他用的是住宅電話)。

通常情況下還有另一種解決方案,即由較熱切的一方主動再打電話,如一個“煲電話粥”成癮的家庭主婦對談話的熱情很高,而她的同伴就未必如此,這種情況下通常是前者再打過去。再如戀愛中的男女遇到這種情況,通常也是由主動追求者再打電話。

由此看來,基於變動收益博弈理論,在生活中遭遇由誰來打電話這類無法用理性得出最佳策略的問題時,按照慣例或隨機應變不失為比較穩妥的選擇。