搜索引擎是因特網上提供信息檢索服務的計算機係統。不同的搜索引擎提供的服務各不相同,檢索的對象各有側重,如網址、文章等等。但所有的搜索引擎大致由三個部分構成:一是在網上搜尋所有信息,並將信息帶回搜索引擎;二是將信息進行分門別類的整理,建立搜索引擎數據庫;三是通過服務器端軟件,為用戶提供瀏覽器界麵下的信息查詢。
目前因特網上的搜索引擎有很多種,其中最著名的是全文式搜索引擎和分類式搜索引擎。全文式搜索引擎是一種對站點頁麵文字內容進行全麵檢索的搜索引擎工具。它的突出優點是信息自動更新快,查詢全麵充分。當它遇到一個網站時,會將該網站上所有的文章全部獲取下來,並收入到引擎的數據庫中。隻要用戶輸入某一查詢的關鍵字,而該字在數據庫中的某篇文章出現過,那麼這篇文章就會返回給用戶。全文式搜索引擎的主要缺點是信息內容不太準確。由於是對站點上每個頁麵的文字進行索引,所以用戶進行關鍵字查詢時,得到的結果通常很多,數據庫中出現過關鍵字的頁麵全部列出,且排列雜亂無序。目前因特網上著名的全文式搜索引擎站點有Altavista(http://www.altavista.digital.com),它有著最大、最詳細的網址索引。
目前世界上最具代表性的目錄或分類搜索引擎是雅虎網站。分類式搜索引擎的優點是將信息分門歸類,用戶能完整係統、清晰方便地查找到某一大類的信息,例如藝術與人類、休閑與體育等。但是,分類式搜索引擎的搜索範圍比全文式搜索引擎要小得多,它不像全文式搜索引擎將網站上的所有文章和信息都收錄進去,而是首先將該網站劃分到某一類別下,再記錄一些摘要信息,對該網站進行簡要概述。例如,你要了解“台灣”的有關信息,分類式搜索引擎能幫你了解到某個大類下內容簡介中涉及“台灣”字樣的信息,全文式搜索引擎則將所有涉及“台灣”字樣的文章查找出來。前者少而精,後者大而全。
對於上網者來說,特別是對於剛上網的新手來說,搜索引擎好像是一位勤勉的導遊,幫助我們去因特網“寶山”探奇尋幽;又像一把萬能的鑰匙,幫助我們開啟信息世界的大門。
因特網上有多少用戶,就有多少人知道雅虎(http://www.yaho.com)。
雅虎是Internet上最受歡迎、最為熱門的搜索引擎,是人氣最旺的網站。它連接速度快,數據容量大,並且是全免費的。
雅虎提供了兩種風格的信息查找方式:列表式目錄連接和關鍵詞查詢。
當你連接到雅虎主頁後,可以看見在Yaho!標題下方有一個文字輸入框,在這裏可以輸入選定的關鍵詞進行快速查找。頁麵其他部分的所有文字幾乎都以連接方式出現,頂部是一些常用連接,如黃頁、尋人、城市地圖等。底部是雅虎自身的一些連接。中部是主體,按內容進行分類,分為文化藝術、商業經濟、計算機與互聯網、娛樂、政府、醫療衛生、新聞媒體、休閑體育、參考資料、國家與地區、自然科學、社會科學、社會文化等部分。
進入網絡世界目錄鏈列表按樹形結構組織,你可以從點擊根鏈開始,不斷深入,最終到達所需的Web頁、新聞組、FTP站和其他可由Web訪問的資源。這種列表式分層搜尋易於控製,適合瀏覽性的查找,但因層次內容太多會感到速度太慢,為此,雅虎提供了另一種選擇,那就是利用關鍵詞匹配查詢。
在雅虎的主頁或任何一個查詢結果返回頁頂部和底部,你都會看見一個輸入框。當你在此填入指定的關鍵詞,單擊右側的Search按鈕後,雅虎就會從它四個方麵的數據庫中找出相匹配的記錄,它們是目錄、網點、網上事件和談話及最新新聞。查詢結果返回的是若幹頁與關鍵詞匹配的記錄列表,最前麵的是目錄鏈,其後是網點,網點記錄通常由標題(以連接形式出現)和簡介組成。如果在雅虎目錄和網點中都沒有相匹配的內容,則自動利用Alra Vista查詢進行整個Web範圍的文檔查找。如想獲得與關鍵詞匹配的最新新聞和網上事件的列表,可以單擊該頁上部目錄條上的相應連接。
目前絕大部分搜索引擎是英文,不支持對中文關鍵詞的檢索,查詢結果以英文形式反饋,查詢範圍不能涵蓋中文網頁,中國的廣大用戶感到很不方便,為此,中文搜索引擎應運而生。