第17章 零和博弈與霍特林模型1(1 / 3)

這一章我們首先正式引入“零和博弈”,然後重點討論經濟學的霍特林模型。

霍特林模型屬於零和博弈,但是它和我們迄今討論過的所有博弈都有很大的不同。在霍特林模型上展示的納什均衡,幾何形象非常鮮明。對於霍特林模型的討論,還部分涉及了2006年秋天我在浙江大學給本科生講博弈論基礎的愉快經曆。

最後我們會談到博弈論模型的對抗性排序。

零和博弈與非零和博弈

類似上一章開頭討論的撲克牌對色遊戲這樣的博弈,叫做零和二人博弈(zero-sumtwo-persongames)。因為參加博弈的隻有兩方,即兩個局中人,所以叫二人博弈。現在,我們把撲克牌對色遊戲博弈的兩個參與人叫做“你”和“我”。兩個公司、兩個國家、兩個集團的博弈,也叫二人博弈。又因為每一個策略對局之下博弈雙方的總支付即雙方得失之和總是0,所以叫零和博弈。在撲克牌對色遊戲中,每一對局之下博弈的結果不外乎你輸一根火柴我贏一根火柴或者你贏一根火柴我輸一根火柴,每一對局之下你的支付與我的支付的總和總是保持為0,所以是零和博弈。

如果博弈參與人不是兩個,而是多個,那麼隻要每局博弈這些參與人的支付之和總是0,就叫做多人零和博弈。

世界上許多國家的孩子們都會玩“布剪錘猜拳遊戲”。如果兩個孩子玩布剪錘猜拳遊戲,布贏錘,錘贏剪,剪贏布,布布打平,錘錘打平,剪剪也打平。當發生輸贏的時候,一定數量的“財富”,比如約定為1吧,從輸家流向贏家,當打平的時候,雙方之間並不發生“財富”的轉移。有興趣的讀者,可以自己把這個布剪錘猜拳遊戲的博弈矩陣寫下來。這將是一個3行3列的表格,左方參與人的三個策略分別是布、剪、錘,上方參與人的三個策略也是布、剪、錘。支付表格的每個格子裏麵,左方參與人的支付的負數,就是上方參與人的支付。左方參與人的支付為1,上方參與人的支付就是–1;左方參與人的支付是–1,上方參與人的支付就是1。總之,每個格子裏麵兩個支付之和,總是0。這個布剪錘猜拳遊戲博弈,當然也是二人零和博弈。

撲克牌對色遊戲的博弈矩陣,有4個格子,每個格子裏麵的兩個數字,都是1和–1。但是布剪錘遊戲的博弈矩陣,有3乘3等於9個格子,其中6個格子裏麵的兩個數字,也是1和–1,不過對角線上3個格子當中的兩個數字,卻是0和0。你可以檢查一下自己做出來的博弈矩陣,是不是這個樣子。

還有一些二人博弈,每局雙方得失之和雖然不是0,卻是一個常數。例如雙方每進行一局博弈除了他們之間的輸贏支付外,還要向提供遊戲器具或者場所的第三方交納一定的租金,則每局雙方得失之和就是一個負的常數。或者反過來,每進行一局博弈,除了他們之間的輸贏支付外,雙方還可以得到“出場費”那樣來自第三方的一定數量的獎勵,則每局雙方得失之和就是一個正的常數。許多體育比賽就是這個樣子。這些博弈都稱為“常和”二人博弈,或者二人“常和”博弈。推而廣之,如果一個多人博弈每局各方得失之和是一個固定的常數,這個博弈就叫做多人常和博弈。

在零和博弈中,任何參與人的每一分錢所得,都是其他參與人之所失。所以,零和博弈是利益對抗程度最高的博弈。其實,常和博弈也是這樣,同樣任何參與人的每一分錢所得,都是其他參與人之所失。由於這個原因,也由於在理性假設之下,常和博弈與零和博弈在處理上沒有質的差別,所以博弈論一般約定不把常和博弈納入非零和博弈的範疇。本書沿用這樣的約定,即如果不作另外的聲明,所說的非零和博弈,專指博弈矩陣各個格子當中的支付之和並不總是相等的所謂“變和博弈”,而不包括非零和的常和博弈。

在非零和博弈中,一個局中人的所得並不一定意味著他的對手要遭受損失,更不一定意味著他的對手要遭受同樣數量的損失。總之,不同局中人的支付之間並不存在“你之得即我之失”這樣一種簡單的關係。這裏隱含的一個意思是,局中人彼此之間可能存在某種共同的利益,蘊涵博弈參與人“雙贏”或“多贏”這一博弈論非常重要的理念。

例如,下圖所示的大家都已經非常熟悉的囚徒困境博弈,就是一個非零和博弈。在這個博弈中,如果雙方彼此合作,都選擇抵賴,則可以實現博弈參與人甲和乙雙贏的局麵,每人隻判入獄1年。在其他對局情形下,雙方總的得益為入獄5年或6年,都比彼此合作選擇抵賴時的入獄2年差。

需要指出的是,雖然雙方都選擇抵賴就能實現兩個參與人雙贏的結局,但如果給定對方選擇抵賴,則我方最好的選擇是坦白。因此,如果沒有一種約束機製,雙方是不可能有激勵維持這種雙贏局麵的。

回到我們的撲克牌對色遊戲。如果單獨把你作為行局中人的博弈支付寫出來,那就得到下圖“你”的支付矩陣。這個矩陣的意義是清楚的。例如右上方格子中的–1表示,如果你翻紅而我翻黑,你的得益就為–1,即你輸一根火柴給我。值得注意的是,上圖的矩陣是我們一直在用的“雙矩陣”,每個格子裏麵有行參與人的支付和列參與人的支付這樣兩個數字,而下圖的矩陣,本質上是我們從代數中早已熟悉的矩陣,每個位置一個數,隻不過代數中一般用兩條弧線或者方括號那樣的兩條豎線括住,現在則從雙矩陣的習慣寫法繼承下來,使用表格。