兩難選擇,合作還是背叛?(1 / 2)

1950年,由就職於蘭德公司的梅裏爾·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出一種相關困境的理論,後來由顧問艾伯特·塔克(Albert Tucker)以囚徒方式闡述,並命名為“囚徒困境”。這也是關於博弈論,流傳最廣的一個故事,在哲學、倫理學、社會學、政治學、經濟學乃至生物學等學科中,獲得了極為廣泛的應用。

故事有很多版本,大意是這樣的:

有一天,一位富翁在家中被殺,財物被盜。警方在此案的偵破過程中,抓到兩個犯罪嫌疑人,並從他們的住處搜出被害人家中丟失的財物。但是,他們矢口否認曾殺過人,辯稱是先發現富翁被殺,然後隻是順手牽羊偷了點兒東西。於是警方將兩人隔離審訊。檢察官說:“你們的偷盜罪確鑿,所以可以判你們1年刑期。但是,我可以和你做個交易。如果你單獨坦白殺人的罪行,我隻判你3個月的監禁,但你的同夥要被判10年刑。如果你拒不坦白,而被同夥檢舉,那麼你就將被判10年刑,他隻判3個月的監禁。但是,如果你們兩人都坦白交代,那麼,你們都要被判5年刑。”

顯然最好的策略是雙方都抵賴,結果是大家都隻被判1年。但是由於兩人處於隔離的情況下無法串供。那麼,囚徒到底應該選擇哪一項策略,才能將自己個人的刑期縮至最短?兩名囚徒由於隔絕監禁,並不知道對方選擇;而即使他們能交談,還是未必能夠盡信對方不會反口。就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。試設想困境中兩名理性囚徒會如何做出選擇:

若對方沉默,背叛會讓我獲釋,所以會選擇背叛。

若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。

二人麵對的情況一樣,所以二人的理性思考都會得出相同的結論——選擇背叛。背叛是兩種策略之中的支配性策略。因此,這場博弈中唯一可能達到的平衡,就是雙方參與者都背叛對方,結果二人同樣服刑5年。

這樣兩人都選擇坦白的策略以及因此被判5年的結局,被稱為“納什均衡”,也叫非合作均衡。從這裏可以引出一個悖論:從利己的目的出發,結果卻損人不利己。兩個囚徒的命運就是如此。從這個意義上說,我們還可以悟出一條真理:合作是有利的“利己策略”。

但它必須符合以下黃金律:也就是我們常說的“己所不欲勿施於人”,且前提是“人所不欲,勿施於我”。

納什均衡的貢獻是,證明了在這一類的競爭中,在很廣泛的條件下是有穩定的解存在,隻要是別人的行為確定下來,競爭者就可以有最佳的策略。他的這項理論工作使得博弈論從此成為經濟學家用來分析商業競爭到貿易談判種種現象的有力工具。

現實中,無論是人類社會或大自然都可以找到類似囚徒困境的例子:

在政治學中,兩國之間的軍備競賽可以用囚徒困境來描述。兩國都可以聲稱有兩種選擇:增加軍備(背叛)、或是達成削減武器協議(合作)。兩國都無法肯定對方會遵守協議,因此兩國最終會傾向增加軍備。似乎自相矛盾的是,雖然增加軍備會是兩國的“理性”行為,但結果卻顯得“非理性”(例如會對經濟造成都有損壞等)。這可視作遏製理論的推論,就是以強大的軍事力量來遏製對方的進攻,以達到和平。

在經濟學中,表現為關稅戰。兩個國家,在關稅上可以有以兩個選擇:

提高關稅,以保護自己的商品。(背叛)

與對方達成關稅協定,降低關稅以利各自商品流通。(合作)

當一國因某些因素不遵守關稅協定,獨自提高關稅(背叛),另一國也會做出同樣反應(亦背叛),這就引發了關稅戰,兩國的商品失去了對方的市場,對本身經濟也造成損害(共同背叛的結果)。然後二國又重新達成關稅協定。(重複博弈的結果是將發現共同合作利益最大。)

在商業中,以廣告戰為例:兩個公司互相競爭,它們的廣告互相影響,即一個公司的廣告較被顧客接受則會奪取對方的部分收入。但若二者同時期發出質量類似的廣告,收入增加很少但成本增加。但若不提高廣告質量,生意又會被對方奪走。