如果撇開感情因素,單純從技術和用戶的角度出發,穀歌和百度的搜索引擎哪個更好,這個問題同樣仁者見仁、智者見智。

百度一直宣稱他比穀歌更懂中文,很多用戶也發現,在搜索某些中文內容的時候,百度的表現的確比穀歌更勝一籌。

2008年,美國一個叫作Globalbydesign的專業博客就這個問題做了一個試驗。他們選取了三個關鍵詞:“許霆”、“次貸危機”和“看羹吃飯”,分別在穀歌的Google。com、Google。cn和百度網站上搜索。他們選取的這三個關鍵詞十分有代表性。“許霆”因銀行自動取款機出錯而惡意取款一事成為當時的輿論焦點,但在中國以外沒有受到多大的關注;“次貸危機”是一個由英語翻譯過來的詞,可以說是中國人自己造出來的新詞;而“看羹吃飯”是浙江的一句方言(大致是有什麼吃什麼,不強求的意思),其他地區的中國人估計都不會用這個詞。

搜索結果出來一比較,“許霆”在百度上有200萬個結果,在Google。com上有144萬個結果,在Google。cn上有133萬個結果。但是直接比較搜索結果的總數是沒有意義的,因為用戶不會一條一條全部看完。在絕大多數情況下,用戶一般隻關注前3頁的內容,即在前30條搜索結果中找自己所要的信息,第10頁之後,也就是100條之後的內容基本上沒有人會去看。

Globalbydesign分別比較了這三個網站對“許霆”的前20條搜索結果,發現都是高質量的網站鏈接,用戶通過這些鏈接基本上能夠對許霆案的來龍去脈有個了解。因此,穀歌和百度在“許霆”這個關鍵詞的搜索上平分秋色。

接下來看“次貸危機”的搜索結果。“次貸危機”在百度、Google。com和Google。cn網站上分別有105萬、38萬和154萬個搜索結果條目。同樣,比較搜索結果的總條目數沒有意義,主要還是看前幾頁的條目是否是高質量的網站。

這回百度要比穀歌做得好,因為在Google。com和Google。cn的前20條搜索結果中,分別有7條和5條是繁體中文。雖然穀歌允許用戶在搜索結果中對簡體中文和繁體中文進行設置,但是如果用戶用“次貸危機”這四個簡體字搜索的時候,很顯然用戶是在尋找簡體中文網站的信息,這個時候穀歌顯示繁體中文網站顯得有點驢唇不對馬嘴了。

而實際上,穀歌搜索結果中簡體中文和繁體中文混雜的問題一直存在。繁體中文的出現或多或少讓簡體中文的用戶感到有點礙事。現在穀歌在識別和處理簡體、繁體中文上的技術進步了很多,但是這個問題還是存在。特別是對於一些簡體、繁體中文書寫完全一致的詞語,如“痞子英雄”,穀歌就要亂很多。筆者在2010年3月份曾用“痞子英雄”作為關鍵詞搜索,百度搜索的結果全部為簡體中文,而Google。com的前幾頁全部為繁體中文的台灣網頁,而Google。cn前幾頁則是簡體中文和繁體中文各占一半。顯然百度把這個問題處理得更好,這也是中國大陸的一些用戶覺得百度比穀歌更好用的原因之一。

最後是這個“看羹吃飯”。這次關鍵詞的搜索結果就很戲劇化了。Globalbydesign的試驗發現百度隻有207個條目,而Google。com和Google。cn則分別有400萬和24萬條結果。乍一看,穀歌厲害多了,但是仔細看一下,就發現不是那麼一回事。百度的207個條目中幾乎每個條目都是精準的“看羹吃飯”這個詞,而Google。com和Google。cn各自前10頁的搜索結果中,沒有一條是精準的,隻是這四個字撒落在句子中間。所以在這一回合的較量中,百度無可爭議的比穀歌強。

這也是很多中國用戶的共識,在對待“看羹吃飯”這樣極其中國化的關鍵詞上,百度確實比穀歌更懂中文。

但是換個角度,如果你是一個搞學術研究的,經常要查一些資料,這個時候,你可能會發現,百度未必比穀歌強。

比如,我們用“靈菌紅素”作為關鍵詞去搜索(2010年3月,下同),穀歌網站上第一條就是來自維基百科(Wikipedia)的。這個維基百科是一個網上的百科全書,涵蓋幾乎所有語言。雖然它的內容是用戶自行編寫的,但是也很有權威性,很多人遇到新名詞第一個想到的就是查維基百科。所以用戶如果搜索“靈菌紅素”這樣的專業名詞,往往都能在穀歌最前麵的幾個搜索條目中找到維基百科的鏈接。但是百度把這個維基百科排到很後麵,重要的一個原因就是百度自己也有一個類似的產品——百度百科,跟維基百科是直接的競爭對手。