由於各種博弈都是各博弈方在競爭某種資源,並以得到多少來判斷勝負,所以,根據所競爭的資源性質可以把博弈分為幾類。

第一種情況是正和博弈。在正和博弈中,由於有大量的資源可供爭奪,所以競爭主要圍繞著對資源的爭奪,而攻擊性較弱,資源越豐富攻擊性越弱,極端情況是資源無限,不會和任何人發生爭奪,隻看你自身的占有能力。比如掌握知識的競爭,這時每個人都在調動自己的全部潛力去占有更多的知識,而不用管別人怎麼樣,這種競爭僅僅指向自身內在潛力的開發而不指向別人,可稱之為競爭意識。

在資源不太豐富的正和博弈中,既存在對無主資源的搶占,也存在對別人所占有資源的攻擊和麵對別人的攻擊采取的防守,隻有在別人的攻擊下不會被奪走的占有才是穩定的。如圍棋盤上占目,隻有做活了才是占住了,沒活以前都有失去的危險,這把自身的潛力向這種帶有占有、防守和攻擊意識的方向發揮可稱之為對抗意識。

第二種情況是零和博弈,各博弈方所得的總和是零。所以,一個人所贏的就是另一個人所輸的,這時最容易引發激烈的競爭。在零和博弈中,沒有無主的資源可爭,占有的唯一方法是剝奪他人的所有,發掘自身的潛力主要向攻擊他人的方向發揮,這時可稱之為攻擊意識。

在零和博弈中,一個人的勝利必然建立在其他人的失敗之上,自己的贏就等價於別人的輸,自己想贏就等價於想讓別人輸。自己對對手要有攻擊意識,對手對自己也具有攻擊意識。對手必然也在時時地尋找你的漏洞,以便通過打擊你而獲利,稍有漏洞就可能被人有機可乘。所以,穩健是零和博弈的要務。

世界首富沃倫·巴菲特曾經打過一個比喻,他說:“好比打撲克牌,如果你在玩了一陣子後還看不出這場牌局裏的輸家是誰,那麼,這個輸家肯定就是你。”贏的前提是不要輸,不要輸的辦法就是自己不要有弱點被人抓住;想贏別人就要抓住別人的弱點,所謂製人而不製於人。出手攻擊別人的時候往往也是最容易暴露自己弱點的時候,所以,一定要先把攻擊的每一個環節都考慮周到,不能有任何的疏忽,否則,沒有必勝的把握就倉促出手,別人就可能趁機抓住自己的弱點,自己可能反倒要被別人贏掉了。一個天衣無縫的攻擊計劃是寓守於攻的。

第三種情況是正和常量博弈,各方所得是恒定的正直,隨著這個值的增大,競爭的激烈程度將逐漸減少,當資源豐富到足以滿足競爭各方的需求時,則接近無限資源,不會引發競爭,當資源總量遠遠少於各方的總需求量的時候則接近零和博弈,會引發激烈競爭,土地資源和水資源都是恒定資源,在水資源缺乏的地區人們會為了爭奪水源發生戰爭,而在水資源豐富的地區則不會發生。

第四種情況是負和常量博弈,即競爭的結果,各方所有的總和將比競爭開始時少,如角鬥士的決鬥,開始時有兩個活人,結束時隻剩下一個活人了,負值越大,則博弈越不容易發生除非是被強迫(如角鬥士)或者為了爭奪某種有特別意義的東西(如騎士為爭奪榮譽),因為各方都明白,參與這種博弈總體上已經先受損了。人能想象出的最殘酷的博弈是幾個博弈方爭奪一個生存權。

傳說古代有毒蠱之術,將多種毒蟲放在一個罐子裏互相鬥,一直鬥到隻留下一隻的時候,這一隻就是最毒的。以符咒法術祭煉這隻毒蟲,百日之後即能飛能隱,去來無形,蠱人於不覺之中。且不說毒蟲是否真的能以符咒煉成能飛能隱的神物,單就把多個毒蟲放在一起鬥出最後的一隻的這種博弈設計和實施已經是用心太毒了,所以煉成毒蠱之術的關鍵不在於鬥出的毒蟲是否真是最毒的,而在於能實施這種事的人肯定是已經具備了一顆刻毒的心,是這種刻毒之心招來了邪惡的蠱神,這才是煉成毒蠱之術所真正需要的條件。

第五種情況是變和博弈,這時博弈的總體效果將決定於各參與方所采取的行動,這種博弈中可以產生合作行為,即各博弈方為了爭取獲得更大的總利益而采取合作行為,必要時可犧牲暫時的利益以獲得長遠上的更大利益。

博弈就是一場對抗

在人類生活中,博弈不僅僅是權衡的結果,更是對抗的成因。因為殘酷的博弈可以使各方都意識到唯有在合作團體中才能使自己在這個殘酷的博弈中取勝,靠一個人單獨的力量是不可能取勝的,所以,競爭壓力越大越會把合作團體結合得更緊密。當然,這種更緊密的合作是以對其他博弈方更為強烈的對抗為代價的,這種博弈會同時培養人的對抗意識與合作精神。

比如,日本民族是一個對抗意識和效忠意識都很強的民族,這是由於其特殊的地理曆史條件決定的。日本是一個島國,國土麵積小,周圍為大海所環抱,多地震多台風,物產不豐富,自然環境條件較差,根據前麵的分析,總資源較少的正和常量博弈必然引發激烈的對抗,形成激烈的對抗博弈。封閉的地理環境又像蠱術中的罐子,把博弈各方關起來,加劇對抗的激烈程度,所以激烈的對抗必然是其曆史特征。事實上,日本在曆史上曾有漫長的時期處於戰國時代,各武士集團之間發生激烈的爭鬥,其殘酷程度無須贅言。

例如,曆史上曾經統治日本數百年的平氏家族,在被德川家打敗之後,族中的男人上至八十歲的老人下至還在母腹中的胎兒,一個不留全被殺光了,當時雖有個別逃走的,但很快也被捉回來殺掉了,因為日本的國土狹小,這種徹底的斬盡殺絕是容易進行到底的。所以,日本武士沒有退路,一旦失敗隻有死路一條,不像中國幅員遼闊,豪傑們中原逐鹿失手還可以遠遁塞外、退守巴蜀或逃到嶺南,逃不走時潛藏於深山也可保全性命。這種沒有退路的博弈態勢養成了日本武士的武士道精神,日本武士沒有偷生的習慣,因為客觀上也沒有偷生的可能,麵對失敗日本武士的傳統選擇是切腹自殺。

這種強烈對抗的博弈,其結果就是培養了日本人強烈的歸屬感和效忠團體的意識。因為在殘酷的博弈下,靠個人的力量是難以生存的,隻有依靠團體力量,共同求得生存。所以強烈的對抗意識是日本民族性格的根本特征,而對團體的效忠精神則是一個次生的特征。時至現代,這種內部團體之間的對抗意識轉化為對他國的對抗意識,而對團體的效忠精神轉化為民族主義,使得日本在國際政治中的作為帶有明顯的民族特點。

其實,不僅在社會生活中,而且在文化方麵也滲透著這種高度對抗造成的張力。日本人不管是研究圍棋還是研究水母(日本天皇裕仁是世界上研究水母的幾個著名專家之一)都有一種縝密、精研、注重細節、一絲不苟的精神,這其實是其內在的對抗意識在思想方法上的反映。

當然,博弈中所競爭的利益,有些是屬於博弈本身的,有些和博弈沒有直接關係,是人為加上去的,如棋賽中的獎金,戰爭背後的利益爭奪等。對任何一種博弈,剝去這種附加上去的利益,都有其最直接的競爭目標,也就是作為博弈的勝負判別標準的那個東西。

如戰爭以進行到最後哪方還具有保留作戰能力決定勝負,一切策略都圍繞這一目的。可以通過政治攻勢瓦解敵軍的士氣,削弱其戰鬥力,所謂“攻心為上”;可以襲擊敵人的指揮部,造成敵軍失去指揮,喪失戰鬥力,所謂“擒賊擒王”;也可以切斷敵人的運輸補給線,使部隊失去戰鬥力;通過正麵戰鬥消滅敵人是最根本的辦法,也是比拚實力的辦法;在比拚實力的戰鬥中為了在戰鬥進行到最後階段時仍然有戰鬥力,保留預備隊是關鍵,預備隊不能過早投入,因為戰爭的勝負決定於最終誰還有戰鬥力。

隻有這個勝負判別標準才是博弈計算的關鍵,也隻有這樣才能落實到操作上,其他東西都是後加上去的,和博弈本身沒有直接關係,不必考慮。其他東西對勝負沒有意義,考慮太多隻能使人患得患失,影響情緒,或者幹擾人的注意力,使人不能集中注意力於博弈本身的勝負,影響正確計算。參與博弈的最佳心態是忘記博弈以外的一切,心中隻有這個最基本的勝負標準,這就是博弈中的“平常心”,這種心態最有利於水平的發揮。

我們可以想象這樣一種情況,兩個圍棋高手,在皇帝的命令下對弈決生死,劊子手已經準備好,輸棋的一個立刻拉出去砍頭,這時候,這盤棋會下得更精彩呢還是更糟糕?一般而言肯定會下得更糟,因為人在這種緊張狀態下思維必然會受到影響。

其實,一盤沒有任何獎懲的棋和一盤決定生死的棋在計算勝負時都是一樣的,勝負所代表的意義是博弈以外的事,和博弈本身無關,對勝負是沒有影響的,應該徹底剝離出去,在計算時不予考慮。再比如在運動場上,優秀的運動員自然能認真參加比賽,用不著以個人或祖國的榮譽來激勵,也用不著以經濟利益來激勵,那種沒有激勵就不能興奮起來的人注定不可能成為真正的高手,那種被激勵出來的鬥誌也是有時起好作用有時起壞作用。

形勢複雜的多方博弈

根據博弈中參與者的數量,博弈可分為雙方博弈和多方博弈。多方博弈是一種最為複雜,難以處理的博弈情況,隨著參與方的增多會演化出許多在雙方博弈中沒有的特征和規律。當前的學術界對這一類博弈還缺乏深入的研究。

在多方博弈中,當博弈方進一步增多時,各方之間的對抗性會被進一步稀釋,極端情況下人們甚至已經不容易感覺到它的攻擊性了。所以多方博弈具有分散攻擊意識,降低各方之間對抗程度的性質,這個特點使得人們在參與其中時常常搞不清自己和其他博弈方之間的關係,不知道該以何種思路去參與其中,不自覺地放鬆了攻擊意識和防攻擊意識,在迷惑中解除了武裝。

多方博弈中個人之間的攻擊意識雖然因分散而減弱,但總體上看每個人所承擔的攻擊意識並沒有減少,因為雖然每個個人對他的攻擊意識減少了,但他要受到來自多方的攻擊意識,其中每一個人對他的攻擊意識都不強,但加到一起就很強了。

事實上,任何博弈中各方都不可能是完全平等的,這種不平等造成各方之間的關係進一步複雜化。每個人都不可能將自己的攻擊意識平均的指向其他每個人,而必然會對不同人有所區別,對有的人的攻擊意識大於平均值而對另一些人的攻擊意識小於平均值。這種不平衡會導致兩個結果,形成密切合作的集團和分化出不同陣營。

當然,一般而言,多方博弈不可能恰好可以劃分為幾大陣營,這種劃分必然帶有某種程度的近似。根據不同陣營之間矛盾的差異,又可以進一步簡化為兩大敵對陣營——敵對雙方,或三大陣營——敵對的兩方加上中間派。這種態勢是最容易理解的,但這種劃分人為性更強,因為它是在把一種客觀的博弈劃分成一種符合人的思維模式的結構。

當博弈變得更加複雜時,直接根據最終獲得利益的多少進行計算就變得比較困難,比如,圍棋的第一個子有361個點可落,第二步有360個點,如果要計算5步以後的局麵就有361×360×359×358×357種可能性,一盤棋一般要進行100個回合200步左右,每一步平均可選擇的點都在150個以上,要想根據最終的勝負標準決定現在的每一步怎麼走,那麼巨大的計算量是無法承受的。解決的辦法是不算到最後勝負,而是對競局中間勝負未分的局麵進行評價,估計這樣一個局麵演化下去會有什麼結果,據以判斷每個階段博弈的勝負。有了這種判斷階段性勝負的標準,就可以根據它來計算當前一步的下法,而不必一直計算到最後終局。

比如,打敗國際象棋世界冠軍的深藍計算機,它取勝的原因除了因為它有巨大的計算能力以外,很重要的一點還在於它的開發小組中有一個國際象棋特級大師加盟,他設計了一套優秀的局麵評價函數,使得深藍可以評價各種局麵下自己的得失。

因為,在多方博弈中,局麵決定於每個參與者的操作,這時要想根據最終勝負標準進行計算就要考慮所有對手將要采取的各種策略組合,決定自己的對策。

比如,當三方博弈時,如果每個對手都有兩種可能的策略,假設他們總是同時操作的,則共有2×2=4種策略組合;如果是四方博弈則有2×2×2=8種組合。依此類推,當參加博弈人數進一步增加時,對手的策略組合數會呈幾何級數增加,極端情況是每一步計算的局麵數量已經多的不可容忍,這時就要對博弈的局麵進行化簡。化簡思路可以對應於前麵討論的多方博弈的幾種策略。

在多方博弈中,由於每個參與者都有加盟某個陣營的內在需求,而加盟進來的人越多則陣營越鞏固。所以,多方博弈中存在形成陣營的機製。多方博弈經過混亂階段的逐步醞釀,會逐漸產生陣營的雛形,而這種雛形一旦產生就會形成正反饋,使這種格局得到強化形成最終的陣營。

比如,戰國時代,戰國七雄中以秦國的野心最大,軍事實力最強,對相對弱小的六國構成威脅。六國之間雖然也有矛盾,但在秦國的壓力下也逐漸聯合,形成了秦國和六國兩大陣營。戰國後期的曆史主要是這兩大陣營之間的鬥爭和六國陣營內部的分分合合。

在陣營的形成過程中,有一些博弈方會采取行動積極促成對自己有利的陣營態勢形成,應用這一策略的成功範例是中國共產黨采取的“團結一切可以團結的力量建立廣泛的統一戰線”的政策。

在前麵的論述中,我們知道,在雙方零和博弈中是不可能出現合作現象的,因為雙方的利益直接對立。但在多方零和博弈中,則可能出現合作現象。比如一個三人博弈,如果單獨考慮其中的兩個人,則這兩個人之間的博弈關係不是零和而是變和博弈,兩個人總和多少決定於第三方損失的多少,兩個人可以通過合作使雙方的總得益增加,這樣就出現了合作關係。博弈方進一步增多時,出現合作的可能性更大,當然這種合作都是以其他方將受到更大的損失為前提的。

比如自然界的生存競爭是一種多方博弈,這種博弈中也自然會形成合作關係,最常見的是種群內部的合作關係,如狼群總是群體出動圍獵的,而人類社會更是以高度合作的方式共同適應環境。除此之外還存在種群之間的合作關係,一個典型的例子是人和狗之間的關係,在與其他動物的對抗中狗是人類的幫手,而人又可以為狗提供更為理想的生存和繁育條件,二者合作的結果是兩個種群在生存競爭中都更為成功。原始人在與大自然的搏鬥中肯定曾大大得益於狗,至今北極的愛斯基摩人仍是如此,人類對狗的感情實源於此。而狗通過和人的合作如今也成了當今世界上數量最多的犬科動物,成為生存競爭中相當成功的一個物種。

即便是在零和甚至負和的情況下,多方博弈的各方之間也可能形成合作,因為從總體上計算博弈雖然是零的,但如果對其中一部分參與者計算,則其總和是可變的,每一個參與者都會想,如果自己和某些其他博弈方合作,共同去對付其他參與者,就可能使包括自己在內的這一合作團體的總利益變大,因而自己的總利益也相應地增大,這比選擇對所有博弈方都對抗的策略要有利。

理想博弈與現實博弈

現實中不存在理想博弈,這一方麵是由於人總是受製於自身的智能,會計算不周,會犯錯誤,但即便是非常簡單的競局也存在轉化為現實博弈的機製。所以,理想博弈轉化為現實博弈是帶有必然性的。

我們看一個猜硬幣博弈的例子。規則非常簡單,兩個人猜硬幣的正反麵賭輸贏,其中一人用手蓋住一枚硬幣,另一人猜是正麵朝上還是反麵朝上,猜對贏一元,猜錯輸一元。

在這個博弈中,要想贏對方就要設法猜出對方將要出什麼而不被對方猜出自己將要出什麼,所謂“製人而不製於人”。猜幣方如果預先知道蓋幣方將出什麼,那麼他就可以猜對,反之,如果蓋幣方預先猜出猜幣方將猜什麼,他可以出相反的麵贏對方,所以誰能猜中對方誰就可以贏。反過來,如果不想讓對方贏,就要想辦法不要讓對方猜中自己將出什麼。所以在這個博弈中有攻守兩套思路,猜對方要出什麼是攻,防止被對方猜出來是守。

進一步分析可知,在博弈反複多次進行時,博弈方要想猜出對方將要出什麼就要盡量捕捉到對手選擇的規律性,如果存在這種規律,就可以利用它猜出對方;從不讓對方猜中的角度考慮,則一定要避免自己的選擇帶有規律性,因為一旦自己的選擇帶有某種規律被對方察覺,對手就可以根據這種規律性判斷出你的選擇,從而對症下藥。