從這個矩陣可以看出,如果兩個廠商都決定做廣告,廠商A賺得利潤10,廠商B仍賺得5。如果廠商A做廣告而廠商B不做,廠商將賺得15,而廠商B隻能賺得零。如果廠商A不做廣告而廠商B做廣告,而廠商A賺得6,而廠商B賺得8,廠商A和廠商B都不做廣告,廠商A賺得10,廠商B賺得2,從以上情況可以看出,如果兩家廠商都是理性的,這個博弈的結果是這兩家廠商都做廣告,這是兩家廠商的上策。
但是,在實際生活中並不是始終存在著上策。上述廣告得益矩陣可能發生以下變化:
變化了後廣告博弈得益矩陣
這個矩陣同上一矩陣的變化發生在右下解,即如果兩家廠商都不做廣告,廠商B賺到利潤2,廠商A將賺到利潤20(看來,廣告費用非常昂貴,而且廠商A的廣告主要是對付廠商B的)。在這種矩陣中,廠商A並不存在上策,它的最優決策取決於廠商B的選擇。在這種情況下,廠商A必須將自己放在廠商B的位置。在廠商B的角度看,登廣告比不登廣告好,在考慮到登廣告的情況下,廠商A也會登。從這裏得出的結論,在B的決策既定的情況下,A所得是它所能做的最好的,在A的決策既定的情況下,B所做的也是它所能做的最好的。
二、非合作博弈中的納什均衡
對於在非合作博弈領域中是否能出現均衡現象,就是說,是否能做到彼此都有利,這是人們在市場經濟中長期探索的問題。
例如,在一個城市中,有東南西北門,是否商業區應該分設在東南西北門,這樣,似乎可以方便顧客,但是,事實上,繁華商業區則集中在城市中心。這就好比在海灘邊上擺攤一樣,通常海邊上的遊泳者都希望在距離自己近的地方購買飲料,因此,攤位似乎應該分散對各自有利,然而,商人都有自己的理性,他想做海灘兩邊顧客的生意,因此,攤位設在海灘中心,你把攤位設在中心,別的小販也會這樣做,於是在海灘中心形成了攤販群體,這就同商業中心一樣。
目前出現的“矽穀”、“高科技工業園區”,以至“中關村”,可能都屬於這類現象。
人們發現,同一城市的兩家航空公司飛往同一目的地的航班往往被安排在同一時間,各電視台為爭取可能多的觀眾,在黃金時段安排能吸引廣大觀眾的節目,以及在總統競選中,要推出能吸引盡可能多的中間立場的選民的綱領等等。在中國傳統哲學中,反對“走極端”,而主張“中庸之道”,這也是追求某種均衡狀態。
在博弈理論中,每一博弈方都是因追求利益的最大化,但同時必須考慮博弈對手的決策或預測可能采取的決策,從而選定自己的對策。
對於這種均衡,美國經濟學家納什在1949年當數學研究生時就作了探索,1994年,納什獲諾貝爾經濟學獎。他在1949年寫的研究生論文《n人博弈中的均衡點》一文提出了被稱為“納什均衡”的基本內容:
“我們可以定義n人博弈中的一個概念,其中每個博弈方都有一個有限純策略集合,並且對應於從每個博弈方的策略集合中各取一個策略組成的每一個n維純策略向量,都有一個對這n個博弈方的確定性支付的集合。對於是在純策略上的概率分布的混合策略來說,得益函數是各博弈方的數學期望,因此,是各個博弈方據以采用他們的多個純策略的多元性線函數形式。”
“任何由每個博弈方各一個策略組成的n維策略向量,都可以看作是n個博弈方的n個策略空間相乘得到的乘積空間中的一個點,一個這樣的n維策略向量就可以導出另一個,隻要滿足每個博弈方在導出n維策略向量中的策略,與被策略向量其他n-1個博弈方的利益結合,能夠給采用它的博弈方帶來最高的期望利益。一個自導出的n維策略向量稱為一個均衡點。”
用比較通俗的語言來解釋,納什均衡就是上策均衡。
在知道博弈方登廣告以後,我方決定登廣告,這是納什均衡。
但是,這裏講的隻是純策略的均衡。現實生活是非常複雜的,存在著許多不確定性,例如,我們有時不清楚對方采取什麼策略,有時對方采取的策略有變化,例如,拿一枚硬幣來說,在這個博弈中,各博弈方選擇正麵或反麵,且兩博弈方同時亮出他們的硬幣,如果兩硬幣對上,博弈方A獲勝並從B處贏得1元,如果兩硬幣沒對上,則博弈方B獲勝並從A處獲得1元。
每個博弈方,各一個策略組成的策略組合,其中每個博弈方的策略,都是針對所有其他博弈方的策略形成的,少一個元素的策略組合的最佳反應,“最佳反應”指的是該策略帶給采用它的博弈方的利益或期望利益,大於或至少不小於其他任何策略能夠帶來的利益。
下列圖表對我們理解什麼是納什均衡很有好處。