第 1 章 赤貧起步的管理大師 2(2 / 3)

“數字圖書館倡議”原本與互聯網無關,它在 1994 年還沒有成

為數字世界的重要力量。斯坦福政府原來的撥款提案甚至沒有提及互

聯網。

但在 1994 年,網景通信公司推出了具有圖形界麵的 Web 瀏覽器。

接下來的一年裏,整個世界突然有了一個存儲和共享一切信息的係統,

這使得“數字圖書館倡議”成為明日黃花。也是在這一年,雅虎公司

成立。“互聯網完全改變了我們腳下的一切。”時任斯坦福大學計算

機科學係主任的埃克托爾·加西亞·莫利納教授說。

每當一種新技術出現時,很少有人真正懂得怎樣去恰當運用。通

常隻有第二代公司才能取得實質性進展。對於搜索引擎而言,這確是

事實。在整個 20 世紀 90 年代,搜索引擎先是根據某站點的特定關鍵

詞的發現次數來檢索網頁。這些引擎並未利用互聯網的互聯特性,隻

是尋找站點、存儲信息。互聯網所要求的新技術尚不存在,是拉裏締

造了它。

當穀歌的搜索引擎在 1998 年 12 月正式推出時,它在一個傑出特

質方麵卓爾不群:它確實管用。

它的核心是 PageRank 係統,這是由拉裏(並以其名字命名)在攻

讀博士期間發明的。它利用了網絡的獨特優勢——與其名稱如此貼切

的互聯網絡。

加西亞·莫利納回憶了公司起步階段的點點滴滴。他是佩奇的顧

問,1995 年的一天,他的學生走進辦公室,給他看所發現的巧妙把戲。

AltaVista 搜索引擎不僅從各個站點收集關鍵詞,還能顯示出與其鏈接

的其他網站。AltaVist 並沒有以穀歌的方式利用這一鏈接信息,但那天

在加西亞·莫利納的辦公室裏,佩奇暗示這是一個排名網站重要程度

的好辦法。

起先,這隻是一個遊戲。“我們那天很開心,一直在看哪些計算

機科學網頁在各個大學中最受歡迎。”加西亞·莫利納回憶道。他們

高興地發現,像斯坦福大學的數據庫小組就比對手威斯康星大學的類

似部門吸引了更多鏈接。

拉裏對於鏈接有自己的看法。他告訴加西亞·莫利納:“既然它對

我們如此重要,為什麼不把它作為搜索程序的一部分?”

拉裏的想法是受其科學背景的啟發。眾所周知,在科學界,當研

究人員在自己的論文中引用你的論文時,就會提高你的論文的可信度。

你被引用的次數越多,你的論文就越被科學界關注。這個想法體現在

尤金·加菲爾德(Eugene Garfield)1960 年創建的科學引文索引數據庫

上,尤金是科學情報研究所的創始人。拉裏推斷,網絡鏈接與科學引

文相似,鏈接最多的引文,可能就是最受研究人員歡迎的引文,並將

被證明最為有用。這些站點應該在搜索結果中首先列出。然後他開始

穀歌的管理哲學

開發自己的軟件,用於分析站點之間的鏈接。

這需要一些棘手的程序。該係統不僅需要計算某個特定站點的鏈

接次數,還要進一步確定所鏈接網站的重要性。這要通過計算對反向

鏈接網站的鏈接數來實現,從而大大增加了分析的複雜性。為了計算

相關性,PageRank 還必須反向追蹤兩步鏈接,並將數據與關鍵詞關聯。

鑒於該係統反向追蹤鏈接的特性,拉裏最初稱其為 BackRub,但他後

來將其命名為更複雜的 PageRank,這是他姓氏的雙關語。

也是出於偶然,謝爾蓋開始了搜索引擎的研究。在斯坦福大學主

修數學和計算機科學博士課程時,他在數據庫小組裏致力於一個研究

項目。1995 年,他和布賴恩·蘭特試圖研究另一種被稱為“關聯數據

挖掘”(associative data mining)的計算機科學方法。這個過程是用來

尋找往往同時發生的信息片段。零售商用它來查詢其銷售記錄,並確

定客戶是否經常一並購買其他物品。不過,數據挖掘是計算機科學的

一個新領域。它需要存儲大量的網絡數據,所以謝爾蓋不得不寫了一

個“爬蟲”(Crawler)程序——用來訪問網站、總結其內容並在研究

生和搜索公司可以訪問的中心位置存儲數據的軟件。其他搜索引擎已

經有了自己的爬蟲程序。

謝爾蓋是一個了不起的程序員和工程師。他的互聯網數據挖掘工

作涉及對海量數據的解析。“他的大手筆其他人根本不會去考慮,”

謝爾蓋的顧問傑弗裏·烏爾曼(Jeffrey Ullman)說。(謝爾蓋關於穀歌

搜索引擎概況的論文,被他自己在另一篇科學論文《服務質量和電子

報紙:Etel 解決方案》中引用。)

謝爾蓋也是一個聰明的硬件工程師。他需要磁盤驅動器來存儲

所收集的數據,但是他資金不足,所以他買下了所能找到的最便宜

的驅動器。但是當他試用時,驅動器卻不夠快。謝爾蓋沒有將它們

扔掉,而是想出了一個辦法,通過加倍驅動器接口的終端數量,總

算使它們可以使用。“我從未想過這麼做,”烏爾曼說,“這是一

流的工程技術。”

1995 年年底,拉裏和謝爾蓋各自的項目使兩人走到了一起。“我

和拉裏聊了很多,”謝爾蓋回憶說,“我們相處得很愉快。”如果拉

裏要搜索網頁,他也需要一個爬蟲。所以他招募謝爾蓋參與數字圖書

館項目,將他的搜索技術和謝爾蓋的網絡爬蟲結合起來。

這是一個偉大的結合。“謝爾蓋喜歡數學方麵的東西,”斯坦福

大學教授安德烈亞斯·佩普基(Andreas Paepcke)說,他負責數字圖書

館項目。“拉裏隻喜歡開發,這正好合乎成長之道。”

另一位與拉裏和謝爾蓋共事的斯坦福大學研究生斯科特·哈桑回

憶說,“那個項目主要以拉裏為主。對於拉裏而言,那是他最重要的

事情。謝爾蓋的參與隻是因為感興趣。”他們常常工作到深夜,在供

應 5 美元“學生特餐”的帕羅奧多“新選擇”餐館編寫網頁索引,並

進行解析。他們經常忙碌到淩晨 5 點。

穀歌的商業潛力

在斯坦福大學時,拉裏和謝爾蓋的搜索引擎每秒鍾可以分析 30 到

50 個網頁。兩年後,速度提高到每秒大約 1000 個網頁。今天則是數

百萬個網頁。這一成功耗費了大量研究和編程。“我們開發了很多數

學方法來解決這一問題,”2000 年,謝爾蓋告訴一位記者說,“我們

穀歌的管理哲學

將整個網絡轉換成了一個擁有數億變量的龐大方程式。”

他們為自己的搜索引擎瞎起了一通名字,其中之一是“What

Box”。“但緊接著我們就發現它的發音像是‘濕盒子’(wet box),

聽起來像是某種色情網站。”謝爾蓋回憶說。為了創造一個大數字,

他們打算將爬蟲稱作“Googol”——數學家愛德華·卡斯納(Edward

Kasner)9 歲的侄兒創造的一個單詞,即指 10 的 100 次方。卡斯納隻

是想為這個從未有過名字的超大數字命名。後來他也杜撰了另一個名

稱“Googolplex”,它是“Googol”的 10 倍。(拉裏和謝爾蓋後來采用

了“Googolplex”來命名他們的公司園區。)

沒有人想過這將成為公司的雛形。大多數人認為雅虎已經在搜

索引擎的競爭中勝出,盡管雅虎實際上隻是一個類似於杜威十進位

製(不帶小數)的分類係統。雅虎是一個門戶網站,它甚至沒有自

己的搜索引擎,而是獲準使用 Akamai 的服務。其他搜公司的高管

也不認為搜索技術可以改進,或者需要改進。拉裏的看法則不同。