在所有關於重複博弈的論述中,聲譽機製與信用問題是最為密切的。由於在完全信息條件下(即參與人“知己知彼”),任何未來的結果都被考慮到決策的公共知識中,因而合作均衡難以得到,四位經濟學家(Kreps,Milgrom,RobertandWilson,1982;KrepsandWilson,1982;Milgrom
andRobert,1982)通過將不完全信息引入重複博弈,建立了一個聲譽模型即“KMRW定理”,擴展了對重複博弈的合作行為的形成機製的解釋。
KMRW定理說明,在囚徒博弈中,每個參與人並不知道對方的類型,即是“理性的”還是“非理性”的。每個參與人自己的類型屬於私人信息,而隻有一個先驗的非0概率(在博弈中是可以根據對手的行為結果進行貝葉斯調整的)假定對手是何種類型。在此條件下,對於一個重複T階段的博弈,隻要T足夠大,必然存在一個T0,使得在所有不到達T0時刻的所有階段的博弈中,參與人都選擇合作。每一個參與人盡管在選擇合作時可能會麵臨被對手出賣的風險,但是如果不合作則暴露了自己的類型,從而失去長期合作收益的可能。因此,如果博弈重複次數足夠多的話,出於對未來收益的考慮,每一個參與人都會盡量樹立自己合作的良好聲譽,以獲得對手同樣的回報。在長期的交易關係中,交易各方都會致力於形象與聲譽的建立和維護,這些聲譽在短期內不經濟,但是長期合作收入預期的補償使得這種聲譽的建立是最優的選擇。
重複博弈的合作均衡形成主要是針對特定個體間的交互關係所達成的合作,它為我們理解市場交易中信用機製的形成提供了理論基石,對於整個社會中普遍信用機製和信用文化甚至信用偏好的形成或建立則必須將這一合作機製置於社會演進的框架內予以研究。關於信用與合作機製演化具有啟發性的研究主要來自於Alchian(1950),Hayek(1988),Axelrod(1980a,1980b,
1984),Axelrod和Hamilton(1981),Nelson和Winter(1982),Nelson(1995),以及一些生物學領域的富有啟發性的研究,如Smith(1974,1978)和Dawkins(1989)等。Smith(1974,1978)以生物演化理論為基礎,提出了一個集體穩定策略(CSS,collectivestablestrategy)。該理論假定存在一個全部采取某一個特定策略的群體和一個采用不同策略的變異個體。如果這個變異個體能得到的收益超過群體中的個體,則這個變異策略就能入侵這個群體。而如果一個群體的策略是不能被入侵的,則就是一個集體穩定的策略。信任與合作的戰略隻有在長期的交互關係中才成為集體穩定策略。如果一個社會形成了這樣一種信用機製,則任何對信用的背叛的變異策略都是無法入侵的,也就是說是不可能擴散的。在社會的演進過程中,信任與合作作為集體穩定的策略必然要灌輸於整個群體內的某種載體和機製上,文化、組織、製度以及宗教、倫理道德等便是這種維護集體合作用的載體(Wilson,E.,1998)。
Axelrod(1980,1980a)對於合作機製演化的研究為連接博弈論關於個體間的合作機製向群體合作機製的過渡奠定了基石。他利用計算機模擬,證明了合作與信用在個體博弈中作為占優均衡出現的可能。Axelrod在模擬中發現,凡是具有善良性(即從來不首先背叛)和寬容性(即在對方背叛以後仍具有合作的傾向)的程序都得分較高。而“針鋒相對”的則集中了善良和寬容的特征,而且思路非常清晰,從不首先背叛,然後采取與對方的上一次行為相同的行動。對此,Axelrod認為善良、謹慎和寬容為長期合作提供了保障:針鋒相對的善良性防止他陷入非合作的麻煩中,對對方背叛的報複則保證了對方背叛行為的謹慎性,寬容性則有助於在對方背叛後重新開始合作,而簡單清晰的規則則易於被人理解,從而導出長期的合作(Axelrod,1984)。