佩奇的馬爾科夫鏈等式現在可以計算幾樣東西:鏈接到特定網頁的頁麵數量;從該網頁鏈接出的網頁數量;人們瀏覽互聯網時,不總是直接從一個網頁跳到另一個與之鏈接的網頁,而可能是從一個新的網頁開始瀏覽,這個機會的大小值也可用該等式來進行計算。所有這些信息都濃縮在PageRank公式裏,這是一種網絡共識經過簡化後的數學等式:
網頁A的PageRank,簡稱為PR(A)。
說明如下:PR(A)是網頁A的PageRank;PR(T1)是鏈接到網頁A上的網頁T1的PageRank;C(T1)是網頁T1鏈出的網頁數;最後,d是一個阻尼係數,取值範圍在0到1之間。更為精確的公式是Google的商業秘密,盡管大家知道阻尼係數一般設為0.85。佩奇說:“我們看看網絡在思索些什麼,其他網頁在說些什麼?這是評價一個可取的網頁的一種相當好的測度方法,因為全世界都認為這個網頁可取。”有一點很重要:有時全世界都是錯的,至少流行輿論會誤傳。還沒有一種搜索引擎能很好解決地解決這一問題。Google要花更多時間去做的,是找出極少數精英所珍視的信息。Google不是一個編輯。人們傾向於相信他們能找到的信息,但這些信息經常有誤。我們在編撰這本書時也發現,許多網站從其他網站簡單地剪切、粘貼信息,而不去核實那些陳述是否真實。互聯網為真假信息的傳播都提供了便利。正如加州大學伯克利分校教授彼得·萊曼對《華盛頓郵報》所說:“圖書管理學專家與計算機科學家進行了一場文化戰爭。Google贏得了這場戰爭。”
1996年,布林和佩奇實現了馬爾科夫鏈的運用,發布了他們的第一個搜索引擎。他們稱之為BackRub(返回觸摸法),取自那些指向網頁的“back links”(返回鏈接)。1997年,他們的工作在斯坦福已經家喻戶曉,隨後就傳遍了互聯網。他們的第一個數據中心是拉裏的宿舍,屋子裏很快就堆滿了電腦和散熱用的風扇。1997年,BackRub啟用斯坦福校園網上的一個新域名www.google.Stanford.edu。克雷格·西爾弗斯坦說:“我們成功的諸多運氣之一是我們在推廣前改了名字,這又是一種創新。拉裏起初想就用現成的名字,後來他從人機交互的角度考慮,認為名字要短,要便於大家鍵入,還要容易拚讀,這樣才易於流傳。”佩奇說:“Google這個名字既有趣、又簡短,相當便於拚寫。”