這一章我們介紹參與人決策有先有後的序貫博弈,這就進入動態博弈的範疇了。
我們首先通過容易理解的“抓錢博弈”,讓大家熟悉序貫博弈的樹型表達,然後介紹幾何上醒目的純策略組合的粗線表示法,在這個基礎上,讀者可以把那些具有單獨偏離動機的策略選擇排除掉,最後得到博弈的納什均衡。
對於樹型博弈來說,子博弈的概念特別容易理解。子博弈清楚以後,運用我們引入的策略選擇粗線表示法和偏離動機策略排除法,馬上可以確定序貫博弈的純策略納什均衡當中,哪些是子博弈精煉的納什均衡。
最後,我們還初步引申向人們關注的博弈論實驗、有限理性理念和行為經濟學。
抓錢遊戲
假如甲乙兩個人參加一個“抓錢遊戲”,他們在各自的托盤前麵坐定。想象托盤上麵將會長出鈔票,設想這是老天爺的恩賜。
一開始,在時刻1:甲麵前的托盤上有1元錢,乙麵前的托盤上也有1元錢,甲處於決策的位置。他有兩種選擇,把錢拿走或者不把錢拿走。如果他選擇把錢拿走,即他把自己麵前托盤上的1元錢拿走,遊戲結束,這時候乙也可以把自己麵前托盤上的1元錢拿走;如果甲選擇不把錢拿走,遊戲進入時刻2。
時刻2:這時候托老天爺的福,甲麵前的托盤上變得有2元錢,乙麵前的托盤上也變得有2元錢,但是輪到乙處於決策的位置。他同樣有兩種選擇,把錢拿走或者不把錢拿走。如果他選擇把錢拿走,即他把自己麵前托盤上的2元錢拿走,遊戲結束,甲也可以把自己麵前托盤上的2元錢拿走;如果他選擇不把錢拿走,遊戲進入時刻3。
時刻3:甲麵前的托盤上變得有3元錢,乙麵前的托盤上也變得有3元錢,甲再次處於決策的位置。他仍然有兩種選擇,把錢拿走或者不把錢拿走。如果他選擇把錢拿走,即他把自己麵前托盤上的3元錢拿走,乙也可以把自己麵前托盤上的3元錢拿走,遊戲結束;如果他選擇不把錢拿走,遊戲進入時刻4。
時刻4:這時候甲麵前的托盤上變得有4元錢,乙麵前的托盤上也變得有4元錢,又輪到乙處於決策的位置。他還是有兩種選擇,把錢拿走或者不把錢拿走。如果他選擇把錢拿走,即他把自己麵前托盤上的4元錢拿走,甲也可以把自己麵前托盤上的4元錢拿走,遊戲結束;如果他選擇不把錢拿走,老天爺被他們不為金錢所動的精神感動,決定獎勵他們每人5元錢,遊戲結束。
如果我們把這個遊戲看做甲乙二人的博弈,需要注意甲乙二人不是同時決策的,而是輪流決策。前麵幾章我們談的都是同時決策的博弈:盟軍和德軍同時決策,疑犯甲和疑犯乙同時決策。現在從抓錢遊戲開始,我們討論博弈各方決策時間有先有後的博弈。
注意博弈論所謂“同時”,不必是在物理意義上的同時,主要是在信息意義上的同時。例如,雖然甲的決策時刻比乙晚,但是甲決策的時候並不知道乙已經作出的決策,那麼在博弈論的討論中,甲乙仍然算是同時決策。這裏的關鍵在於,乙決策的時候固然不知道甲的決策,因為甲的決策時刻從物理上說比乙晚,但是甲決策的時候同樣不知道乙的決策,盡管乙的決策已經作出。所以,他們在有關博弈的信息方麵,處於同等的位置。
典型的例子是工程招標。假定截標時刻是7月8日中午12點,那麼因為密封投標,如果甲在7月6日投標,乙在7月7日投標,丙在7月8日上午投標,在博弈論意義上他們都是同時投標。當然,如果丁在7月8日下午甚至7月9日投標,我們應該不認為丁和甲乙丙同時投標。
前麵幾章討論的同時決策博弈(simultaneous-movegames),是靜態博弈(staticgame);現在說的決策有先有後的博弈,叫做序貫決策博弈(sequential-movegames),是動態博弈(dynamicgame)。這裏需要注意,隻要參與人的決策不是同時的決策,就是序貫決策博弈,而不必非得是輪流決策的不可。例如甲乙丙三人博弈,假定決策按照“甲—乙—丙—甲—乙—甲—丙—乙—丙”這樣的次序進行,也是序貫決策博弈。總之是有先有後。
序貫決策博弈因為決策有先有後,一般不采用前麵兩節介紹的矩陣表示方法,而多采用下圖那樣的“樹型”表示方法。想象自左往右從“根”開始生長的一棵“樹”,在生長的過程中不斷分枝。根和分枝點是決策節點(decisionnodes),樹梢即各枝梢是末端節點(terminalnodes)。博弈的“樹型表示”,就是要在每個決策節點處說明這是誰的決策點,並且說明在這個決策點供他選擇的策略或者行動有多少,是什麼,而在每個末端節點,因為博弈如果“走到”這裏,就會結束,所以我們在每個末端節點標示出博弈如果走到這裏每個參與人的得益。在每個樹型博弈中,末端節點的括號,按照明確約定或者默認約定的順序,給出各參與人的支付。通常的做法,是采取博弈參與人在博弈中首次出場決策的自然順序,來排列括號中各參與人的支付。例如甲乙丙三人參與的決策順序是“甲—丙—甲—乙—甲—丙—乙—丙”的序貫決策博弈,如果不另外申明,末端節點那裏的括號,就按照(甲的支付,丙的支付,乙的支付)這樣的順序,給出參與人的博弈得益。