梯若爾
【主要內容】
1.寫作背景
本書雖然寫作於20世紀90年代初期,但作為博弈理論的領軍人物,兩位作者吸收了最前沿的理論成果。十多年來,博弈論的進展不大,因而盡管出版11年來此書一直沒有進行修訂,但時至今日,它仍然是博弈論領域最前沿的教科書。
寫作這本書時,讓?梯若爾與朱?弗登伯格正師從於埃瑞克?馬斯金(Eric Maskin)教授,馬斯金在他辦公室的多次講授中將現代博弈論的文獻不斷介紹給梯若爾和弗登伯格,因此從那個時候起,兩位作者就從與馬斯金的合作中受益匪淺,並吸收了他思想的精華。
1994年,諾貝爾經濟學獎頒給了納什等三個人,主題自然是博弈論。納什憑其開山之作獲得諾貝爾獎當之無愧。但是,這隻是一半。納什的這篇“n人博弈的均衡點”開辟的思路現在被稱為“非合作博弈”,這也是現在運用最廣,研究最深入的一個方向。梯若爾與弗登伯格合著的名著《博弈論》就是全麵總結非合作博弈的裏程碑。
梯若爾認為:“博弈論是研究人與人之間、組織以及國家之間的相互作用。我們用博弈論這種工具把相互作用公式化,並由此開始思考政治學、經濟學和社會學的許多問題。我們所做的工作是給出一些工具幫助我們了解一些情況的含義。我們假設人們按照自己的利益行事,當然有時人們從自身利益出發也會選擇合作。我們來尋找係統的均衡,比如納什均衡,即每個人從自身利益出發行動,看這樣會有什麼結果。”這種思想很重要,因為當你設計機製或者改革的時候,你必須考慮會發生什麼情況,行動者在這樣的情況下會怎樣做,如果想把事情分析透徹,就必須用博弈論表述出來,這樣就能知道改變遊戲規則時會有什麼樣的結果。弗登伯格和梯若爾寫的這本《博弈論》用數學方式表達,係統而全麵,也有相當深度。其實我們每個人每天都在不自覺地用博弈論方法作出各種決策。博弈在生活中,博弈論也在生活中。
但是,在經濟學文獻中對博弈論最早的研究是古諾(Cournot,1838),伯川德(Bertrand,1883)和埃奇沃斯(Edgeworth,1925)關於壟斷定價和生產的論文,但這些都被視為特例而沒有改變經濟學家對大多數問題思考的方法。約翰?馮?諾曼(John von Neumann)和奧斯卡?摩根斯坦(Oskar Morgenstern)在他們1944年著名的《博弈論和經濟行為》一書中引進了通用博弈理論的思想,並提出大部分經濟問題都應該用博弈來分析。他們介紹了博弈的擴展式和策略式的表示法,定義了最小最大解,並證明了這個解在所有兩個參與人的零和博弈中存在。納什(Nash,1950)提出“納什均衡”的概念,這一概念把博弈論的分析擴展到非零和博弈,這也是古諾和伯川德所研究的特定模型均衡的一個自然推廣,並且它是大多數經濟分析的起點。
近年來,澤爾騰(Selten,1965)引入了“子博弈完美性”的概念,通過這個概念排除了納什均衡中不合理的均衡解,即那些依賴於不可信威脅的均衡解。通過子博弈完美均衡可以分析一些動態博弈和重複博弈。海薩尼(Harsanyi,1967―1968)提出了使用標準博弈論技術來模型化不完全信息情形的方法,在不完全信息下,參與人對其他人的支付是不確定的,由此而引出的貝葉斯納什均衡是很多博弈論分析的基礎。但是當信息不完全和動態博弈同時出現時,貝葉斯納什均衡就顯得太弱了,這就好比納什均衡在動態博弈中允許空洞威脅存在一樣,不完全信息博弈的求解依賴於將子博弈完美性的思想擴展,這些求解思想按照限製性從小到大順序分別是完美貝葉斯均衡,克瑞普斯和威爾遜(Kreps and Wilson)的序貫均衡以及澤爾騰(Selten,1975)的顫抖手完美均衡,這些思想在掠奪博弈和勞動力市場信號傳遞博弈中有廣泛的應用。因此,1994年,諾貝爾經濟學獎獎給了澤爾騰、海薩尼和納什三人。梅爾森(Myerson,1978)給出適當均衡的概念,他對完美均衡進行了精煉,要求沿著被擾動策略的收斂序列上參與人在代價越高的“錯誤”上犯錯的可能性越小。
《博弈論》的兩位作者讓?梯若爾和朱?弗登伯格正是對前人的非合作博弈進行了高度的總結,本書涵蓋了非合作博弈的全部重要內容,不僅包括策略式博弈、納什均衡、子博弈完美性、重複博弈以及不完全信息博弈等常規內容,而且還包括馬爾可夫均衡這樣的非常規內容。作為整個博弈理論中最為經典、與經濟學中理性人假設最一脈相承、也是應用最為廣泛的理論,非合作博弈是博弈理論中最為重要的部分,並且在相當一段時間裏還將如此。此外,盡管對於一些研究者來說,該書可以作為一本參考書或者是部分文獻的導讀,兩位作者寫作本書的主要目的是將其作為一本博弈論課程的教材,因而該書集中介紹了一些概念和一般性的結論,案例的使用上也主要是“簡化的例子”而不是具體的應用。
2.主要內容
《博弈論》一書寫作於90年代初,但是至今仍然是經濟學者和研究生的常備參考書。由於90年代之後博弈論的發展速度放緩,該書的內容基本上仍然處於前沿的位置。該書有以下幾個特點:第一,覆蓋麵廣,幾乎涵蓋了博弈論的各個領域;第二,關注博弈論發展的前沿,參考書目齊全;第三,深入淺出,既可以滿足一般讀者對博弈論的了解,也可以滿足愛好技術性證明的讀者對於博弈論精髓的把握;第四,本書的兩位作者本人就是成就卓著的博弈論專家,他們在寫作本書時因此能把握全局,將博弈論紛繁複雜的內容整理為邏輯嚴謹的章節,極大地方便了讀者對博弈論整體的把握。
該書的整體布局從易到難,第1篇從兩個獵人參與獵鹿還是獵兔的決策開始,介紹了最簡單的參與人同時行動的博弈模型,這種模型可以通過策略式博弈和納什均衡來研究;但是博弈論的應用對於有動態結構的情形更加感興趣,這種動態博弈可以用“擴展式博弈”的概念把這種情形模型化。在第2篇完全信息的動態博弈中,討論了擴展式博弈的的建模方法,擴展式博弈的求解方法早在斯塔克伯格的教科書中就有詳細地論述,該書中引入澤爾騰的子博弈完美均衡的概念,使得逆向歸納的思想更加規範,可以延伸到擴展式博弈中。在動態博弈中,我們了解的最透徹的是重複博弈,在第5章中給出了係統處理重複博弈的一般方法。如果在一個博弈中,某些參與人不知道其他參與人的收益,那麼這個博弈是不完全信息博弈,該書前兩章的內容都是在完全信息假設下給出的,對於不完全信息博弈,該書重點討論了一類特殊的不完全信息博弈――機製設計博弈,這大概與作者對產業經濟學有特殊的興趣有關吧。在完全信息中引入的子博弈完美性的概念對於不完全信息不起作用,不完全信息導致的複雜性表現在:即使每一期的期末參與人都觀察到了別人的行動,由於參與人不知道別人的類型,所以從某一時期的開始並不能定義良好的子博弈,因此也就無法檢驗後續的策略是否是一個納什均衡。在第4篇不完全信息的動態博弈中發展了兩個概念:“完美貝葉斯均衡”以及克瑞普斯和威爾遜的“序貫均衡”,他們將子博弈完美性擴展到不完全信息博弈。在這一篇中所發展的完美貝葉斯均衡隻限於帶有可觀察到的行動和不完全信息的多階段博弈,與之相對照,序貫博弈是為一般的博弈定義的,它考慮了受擾動的博弈並對其加以精煉,同樣的情形出現在澤爾騰的“顫抖手完美性”的概念中。盡管按照曆史順序“顫抖手完美性”出現在“序貫均衡”之前,但是該書中按照它們的曆史順序倒過來的情形加以介紹,目的是為了把更容易理解的“序貫均衡”放在前麵。最後,在第8章結束,討論了完美貝葉斯均衡、序貫均衡和顫抖手完美性均衡的精煉。接下來該書在第9章討論了聲譽效應,聲譽效應主要是考慮如果一個參與人總是用一樣的方式博弈,他的對手就會預期他在將來繼續這樣博弈,從而相應地調整自己的行為,問題是這個參與人是否以及何時能夠建立或維持他所希望的聲譽?直覺上聲譽很像資產,當一個參與人有耐心並且他的計劃比較長遠時,他有可能願意用短期的成本去建立他的聲譽,因此,該書中主要關注的是長期關係中的聲譽問題。同時這一章也是作者弗登伯格擅長使用的博弈分析工具,在該章中使用了很多弗登伯格在《博弈論學習理論》(The Theory of Learning in Games)中的案例。在第10章中討論了不完全信息下的序貫議價,從20世紀80年代前期起,許多人都提出了不完全信息序列博弈的模型,盡管公理化的非合作博弈是議價問題主要解決方法,但是非合作博弈在解決議價問題上遠未成功。這主要是由於兩方麵的困難:首先是在完全信息和不完全信息的模型中均衡的結果對於擴展型的選擇非常敏感;其次由於信息的不完全,擁有私人信息的議價者如果提出協議,那麼就可能出現非常多的完美貝葉斯均衡。那麼,即使知道了博弈的擴展型,運用議價理論也未必可以給出唯一的預測。該書中對於“單邊出價”議價博弈還是給出了某種很強的結果,對於議價過程更為複雜的博弈,作者將靜態機製設計和序貫議價聯係起來,並特別討論了某種序貫議價博弈中的某種均衡會產生什麼樣的激勵相容和個人理性的博弈結果。在該書的最後,作者提供了博弈論的高級專題,這些對於想深入研究博弈論的理論和應用的人都會受益匪淺。