第6段(1 / 1)

是屬於競局本身的,有些和競局沒有直接關係,是人為加上去的,如棋賽中的獎金,戰爭背後的利益爭奪等。對任何一種競局,剝去這種附加上去的利益,都有其最直接的競爭目標,也就是作為競局的勝負判別標準的那個東西。如戰爭以進行到最後哪方還具有保留作戰能力決定勝負,一切策略都圍繞這一目的。可以通過政治攻勢瓦解敵軍的士氣,消弱其戰鬥力,所謂"攻心為上";可以襲擊敵人的指揮部,造成敵軍失去指揮,喪失戰鬥力,所謂"擒賊擒王";也可以切斷敵人的運輸補給線,使部隊失去戰鬥力;通過正麵戰鬥消滅敵人是最根本的辦法,也是比拚實力的辦法;在比拚實力的戰鬥中為了在戰鬥進行到最後階段時仍然有戰鬥力,保留預備隊是關鍵,預備隊不能過早投入,因為戰爭的勝負決定於最終誰還有戰鬥力。

隻有這個勝負判別標準才是博弈計算的關鍵,也隻有這個才能落實到操作上,其它東西都是後加上去的,和博弈本身沒有直接關係,不必考慮。其它東西對勝負沒有意義,考慮太多隻能使人患得患失,影響情緒,或者幹擾人的注意力,使人不能集中注意力於競局本身的勝負,影響正確計算。參與競局的最佳心態是忘記競局以外的一切,心中隻有這個最基本的勝負標準,這就是競局中的"平常心",這種心態最有利於水平的發揮。

我們可以想象這樣一種情況,兩個圍棋高手,在皇帝的命令下對弈決生死,劊子手已經準備好,輸棋的一個立刻拉出去砍頭,這時侯,這盤棋會下得更精彩呢還是更糟糕?一般而言肯定會下的更糟,因為人在這種緊張狀態下∫

當博弈變得複雜時,直接根據最終獲得利益的多少進行計算就變得比較困難,比如,圍棋的第一個子有361個點可落,第二步有360個點,如果要計算5步以後的局麵就有361×360×359×358×357種可能性,一盤棋一般要進行100個回合200步左右,每一個步平均可選擇的點都在150個以上,要想根據最終的勝負標準決定現在的每一步怎麼走,那麼巨大的計算量是無法承受的。解決的辦法是不算到最後勝負,而是對競局中間勝負未分的局麵進行評價,估計這樣一個局麵演化下去會有什麼結果,據以判斷每個階段博弈的勝負。有了這種判斷階段性勝負的標準,就可以根據它來計算當前一步的下法,而不必一直計算到最後終局。

比如,打敗國際象棋世界冠軍的深藍計算機,它取勝的原因除了因為它有巨大的計算能力以外,很重要的一點還在於它的開發小組中有一個國際象棋特級大師加盟,他設計了一套優秀的局麵評價函數,使得深藍可以評價各種局麵下自己的得失。

對局麵的評價是帶有經驗性的,而且對一個具體局麵評價還與自己的棋風以及對手的棋風有關,有的人重視實地,有的人重視外勢,對一個重外勢的棋手來說,外勢在評價時占的比重較大,而對一個重實地的棋手來說,實地在評價時占的比重較大。反之,如果和一個擅長取勢的對手下棋,讓他得了大量的外勢是不利的,但如果是和重視實地的對手下棋,就不防多送他一點外勢。所以,對同一局麵,不同的人會有不同的評價,同一個人同一個局麵,當對手不同時評價也會有所不同。根據不同的評價又會產生不同的行棋策略。比如,深藍在與卡斯帕羅夫交手時,由於卡斯帕羅夫已是世界公認的高手,局麵已成隻要戰勝他一人就等於打敗了世界上最優秀的棋手,一時這場比賽成了全世界關注的世紀之戰。但前幾次交手深藍都失敗了,後來深藍小組專門針對卡斯帕羅夫的棋風進行了攻關而最終取勝。這一次深藍在速度上並沒有提高,但它的評價函數被設計的專門適合對付卡斯帕羅夫的棋風。這種辦法多少有些賴皮,但又不能說不對,因為棋手在比賽時實際上也經常采取這種有針對性的策略,隻不過棋手采取什麼策略是棋手自己選擇的,所以贏了還是棋手自己贏的,而深藍針對卡斯帕羅夫采取什麼策略是別人幫它選擇的,不是它自己找到的,所以多少有些問題。

博弈過程變長會帶來計算的複雜性,博弈方增多也可以帶來複雜性。多方博弈中,局麵決定於每一個參與者的操作,這時要想根據最終勝負標準進行計算就要考慮所有對手將要采取的各種策略組合,決定自己的對策。比如,當三方競局時,如果每個對手都有兩種可能的策略,假設他們總是同時操作的,則共有22=4種策略組合;如果是四方競局則有23=8種組合。依此類推,當競局人數進一步增加時,對手的策略組合數會呈幾何級數增加,極端情況是每一步計算的局麵數量已經多的不可容忍,這時就要對博弈的局麵進行化簡。化簡思路可以對應於前麵討論的多方競局的幾種策略