正文 第12章電子法律文獻信息的檢索及利用(1 / 3)

一、電子文獻的檢索方式及策略

(一)檢索方式

檢索方式就是數據庫所設計的可供讀者檢索的途徑和方法。法律數據庫的檢索方式包括:基本檢索、詞組檢索、索引詞典檢索、高級檢索、綜合檢索等方式。

1.基本檢索(BasicSearchorSimpleSearchorQuickSearch)

基本檢索是讀者向數據庫提交一個檢索詞或某一特征屬性的查詢,並返回檢索結果。如輸入一個關鍵詞、分類號、題名、著者名稱以及出版年限、學科屬性等特征字段。

2.二次檢索(SecondSearch)

二次檢索是在基本檢索的結果範圍內,選用新的檢索詞以限製檢索範圍,控製檢索結果,進行目標逼進檢索。

3.詞組檢索(WordCombinationSearch)

詞組檢索,即允許將兩個或兩個以上單詞或一個多詞的語句作為一個獨立的運算單元進行查詢。不同的存取係統對語句中詞與詞之間的處理方式不同,其檢索結果的精確度也不-樣。現有搜索引擎一般都將詞組或短語置於引號“”內表示。詞組檢索常被稱為精確檢索或短語檢索。

4.索引詞典檢索(CatalogSearch)

索引詞典檢索,按照係統提供的索引詞典選擇檢索詞查詢,采用此方式用戶一般不需要輸入提問詞,隻是按照數據庫所提供的瀏覽模式,逐級分類地進行瀏覽察看。

5.高級檢索(AdvancedSearch)

高級檢索,目前絕大多數的數據庫都具有向用戶提供一項或多項高級檢索的功能。高級檢索包括以下五種檢索方式。

(1)布爾邏輯檢索

大多數存取係統都能夠進行邏輯和、邏輯或和邏輯非3種邏輯運算,提供3種布爾邏輯查詢;還有一部分係統隻能進行兩種或-種邏輯運算。此外,大多數存取係統允許采用命令驅動方式使用邏輯運算符,另有一些係統允許采用菜單選項代替邏輯運算符的輸入。

邏輯運算符AND(與)OR(或)NOT(非)

檢索式AandBAorBAnotB

檢索式簡便形式A*BA+BA-B

命中A和B都出現的記錄A和B至少有一個

出現的記錄隻出現A,而不

出現B的記錄

圖示

布爾邏輯檢索運算順序:從左到右;括號內的邏輯運算先執行,多重括號先運行小括號,再大括號;通常先運算NOT,再運算AND,最後運算OR。

(2)模糊檢索

模糊檢索也叫概念檢索,即係統不僅可根據輸入的關鍵詞進行檢索,而且會自動地采用該關鍵詞的同義詞和近義詞進行查詢以提高檢索效率。但此功能的實現要求係統事先必須配備一個相當於後控詞表的同義詞、近義詞詞表。

(3)截詞檢索

截詞檢索主要是利用檢索詞的詞幹或不完整的詞形進行檢索。截詞符多用星號“*”表示,通配符用“?”表示。

右切截:在欲檢索的詞彙字根後加上係統規定的符號,如:輸入「librar?」,則可檢索出內含library、libraries、librarian、librarians、librarianship等字。

左切截:在欲檢索的詞彙字尾前加上係統規定的符號,如:輸入「?gravine」,則可檢索出內含landgravine、margravine等字。

左右切截:因英美用法或單複數的關係致使檢索詞彙有不同的拚法,則可在檢索詞彙中加入係統規定的符號,如:輸入「lab?r」,則可檢索出內含labor、labour等字。

(4)字段限定檢索

即采用字段標識符將檢索詞限定在特定字段內進行查詢,光盤存取係統與聯機存取係統的字段限定有前綴和後綴兩種方式。各類搜索引擎的字段限定多為前綴方式,如(T1)infonnation2(AU)Taylor等。

(5)相鄰度檢索

在聯機存取係統和光盤存取係統中用得較多,少數搜索引擎具有Near位置查詢功能。

6.綜合檢索

綜合檢索(SynthesisSearch),即充分利用存取係統的各類檢索功能,綜合交替使用各類檢索方式;或選用功能不同的存取係統進行重複查詢,以擴大檢索範圍,增加檢索途徑,提高檢索效率。綜合檢索是基本檢索、二次檢索、詞組檢索、索引詞典檢索以及高級檢索等5種檢索方式的組合,讀者可以根據檢索的需要選擇其中的兩種或幾種檢索方式進行組合使用,以達到快速、精確檢索的目的。例如讀者使用模糊檢索,此種檢索方式檢索出的結果往往比較多,在篩選檢索結果時,讀者就可以使用二次檢索,在前一次檢索的結果中檢索,這樣就可以輸出相對精確的信息,二次檢索可以多次使用。

(二)檢索策略

檢索策略是為實現檢索目的,對檢索的全過程進行統籌規劃,科學運用檢索詞和邏輯運算符正確地構造檢索式的原則和方法。檢索策略如果使用得當,不僅可以快速檢索到文獻,而且檢索結果的準確率也比較高。因此,在進行檢索之前應提前擬定檢索策略。另外,建議讀者在檢索時記錄檢索過程,因為,部分數據庫會提供檢索曆史查詢(search-history),此時讀者可以根據檢索曆史,修改檢索策略,避免因重複檢索而浪費的時間。以下為擬定檢索的步驟圖:

(三)檢索反饋

根據製定的檢索策略,得到檢索結果,可是怎樣說明檢索策略的好壞以及數據庫的優劣?在此使用查全率和查準率兩個指標來分析檢索策略的優劣和讀者滿意度來表示讀者對該數據庫的優劣的評價。

查全率是指係統在進行某一檢索時,檢出的目標文獻量與係統文獻庫中相關文獻總量的比率,它反映該係統文獻庫中實有的相關文獻量在多大程度上被檢索出來。

查準率是指係統在進行某一檢索時,檢出的目標文獻量與檢出文獻總量的比率,它反映每次從該係統文獻庫中實際檢出的全部文獻中有多少是相關的。

讀者滿意度是讀者對檢索結果的一種評價。在此可以使用檢索實際效果與讀者預期來表達讀者滿意度。

檢索策略無差異,用於表示讀者使用不同的檢索策略、不同的檢索詞以及不同的檢索方式,其檢索結果使得讀者的滿意度相等。

查全率=[檢出的目標文獻量/文獻庫內相關文獻總量]×100%

查準率=[檢出目標文獻量/檢出文獻總量]×100%

讀者滿意度=[(查全率×P+查準率×(1-P))/讀者的預期]×100%

其中:P為讀者所設置的查全率與查準率之間的權重。

在上圖中查全率與查準率成反比。查全率是檢索出相關文獻量與數據庫中相關文獻總量的比值,而查準率是檢索出的相關文獻量與檢索出文獻總量的比值。當查準率高時,查全率會相對低;當查準率低時,查全率相對高。由於數據庫的具體相關文獻總量不確定,所以隻能籠統地說查全率與查準率成反比,而不能用明確的函數表達式來表述它們之間具體的反比關係。

檢索策略無差異曲線C:表示在此曲線上由查全率與查準率所組成的點對檢索策略優劣的評價一致,也就是在此曲線上所有點的讀者滿意度相等。通過讀者使用檢索策略A與使用檢索策略B檢索出的結果,計算出在這兩種檢索策略下的查全率A、查準率A與查全率B、查準率B,並計算出讀者滿意度A與讀者滿意度B。

如果讀者滿意度A=讀者滿意度B;則說明這兩種檢索策略給讀者的效用一樣,這兩種檢索策略無差異。

如果讀者滿意度A>讀者滿意度B,則說明檢索策略A優於檢索策略B。

如果讀者滿意度A

讀者滿意度曲線L:表示讀者對該數據庫的評價。此時計算讀者滿意度的查全率與查準率不是前麵所提到的針對某些檢索策略的查全率與查準率,而是一種綜合的使用該數據庫進行信息檢索時所表現出來的查全率與查準率。此表述比較抽象,計算時可使用眾多有效檢索策略的查全率與查準率的加權平均作為表示該數據庫的查全率與查準率。讀者滿意度曲線L大體上可以看做是一條關於查全率與查準率的線性函數,如上圖所示。

讀者使用上述的模型,在檢索過程中,統計檢索結果,計算出以上的各個參數,即可評價出不同檢索策略的優劣,便於以後讀者選擇好的檢索策略。而計算出的讀者滿意度由於是單次檢索,其誤差較大,讀者應針對不同的內容進行多次檢索,然後取其平均值作為讀者對該數據庫的滿意度。讀者滿意度這一指標因為具有個人主觀因素在裏麵,難以避免對該數據庫評價有誤差。要想客觀反映這一參數,減小誤差,可以擴大讀者數量,進行加權平均。得到檢索策略與對數據庫的滿意度參數,讀者可以在再次檢索時選擇更好的數據庫與檢索策略,提高檢索效率。

二、法律信息分類檢索及實例

(一)法律圖書、法學論文的檢索

1.法律圖書的檢索

(1)法律圖書檢索語言

檢索語言是根據檢索需要而創造的一種人工語言。要檢索法律圖書,必須按照一定的著錄格式,選定恰當的檢索詞作為檢索點,確定該圖書的檢索屬性。檢索語言可保證不同檢索人員表征文獻信息的一致性,使內容相同或相關的文獻集中化,以便使得讀者按照不同的需求檢索文獻信息時都能獲得最高的查全率與查準率。下圖介紹圖書分類檢索語言,圖中介紹了分類語言的發展與沿承,以及現在常用的分類語言,現在圖書館普遍使用第四版《中國圖書分類法》。然而對於非圖書館專業的人來說,按分類號檢索圖書有一定的難度,為了方便讀者,還設置書名、責任者、出版社等信息作為檢索點,進行直觀的檢索。

(2)法律圖書的檢索步驟

首先,選擇適合的檢索詞,以題名、責任者、出版社、出版年、叢書名等著錄項作為檢索詞。其次,選擇檢索的對象,可以是實體圖書館的聯機檢索目錄,也可以是數字圖書館的電子資源。再次,按照所選擇的檢索詞在所選的檢索對象中檢索結果。最後,在檢索出的結果中篩選自己需要的信息。實體圖書館的聯機檢索目錄在此不再贅述,下麵介紹一下幾個常用的數字圖書館。

方正Apabi數字圖書係統由北大方正電子有限公司製作,包括了全國數百家出版社數十萬種高質量的電子書,內容涉及社會學、哲學、宗教、曆史、經濟管理、文學、數學、化學、地理、生物、醫學、工程、機械等多種學科。該庫電子圖書基本上與出版社的紙質圖書同時出版,以新書為主。其中包含的法律圖書比較少,隻有119本。

書生之家是北京書生科技有限公司利用其全息數字化技術,經數百家出版單位授權建立起來的數字圖書館係統平台,目前收錄了2000年以來國內出版的十多萬種圖書。法律電子圖書共有5186本。

超星數字圖書館是由北京世紀超星信息技術發展有限責任公司投資興建的,涵蓋文學、曆史、法律、軍事、經濟、科學、醫藥、工程、建築、交通、計算機和環保等學科,目前擁有數字圖書十多萬種,並以每天數百種的速度增加。

浙江大學主辦建立的百萬冊數字圖書,收錄有:古籍、民國圖書、民國期刊、現代圖書、學位論文、繪畫、視頻等內容。其中收錄有大量的法律圖書。

讀秀學術搜索是全球最大的中文文獻資源服務平台,有280萬種中文圖書元數據、160萬種圖書原文、6億頁資料,約占1949年以來所有出版中文圖書數量的95%以上。讀秀的檢索係統是一個立體深度的檢索係統,它提供了書目、章節、全文三個檢索頻道,實現了目錄和全文的垂直搜索,使讀者在最短時間內獲得深入、準確、全麵的文獻資源。讀秀的圖書檢索係統不但能顯示圖書的詳細信息,還提供圖書的原文顯示,使讀者能清楚地判斷是否是自己需要的圖書,提高了信息檢準率和讀者查書、借書的效率。

(3)檢索實例

如一讀者要查詢“票據法”方麵的圖書,則可以分別選擇上述幾個數據庫,按照題名進行檢索。檢索結果如下:

①方正Apabi數字圖書係統。通過方正Apabi數字圖書係統,在快速檢索選項中選擇“全麵檢索”,檢索詞設為“票據法”,結果隻檢索到4條記錄,沒有與作者要求完全一樣的條目,隻是相關圖書。檢索結果如下:

②書生之家。通過書生之家進行檢索,在檢索選項下選擇“圖書名稱”,檢索詞設為“票據法”,可得到21條檢索信息。檢索結果如下:

在此檢索結果中,讀者可以根據自己的需要選擇自己所要檢索的圖書,然後點擊後麵紅色“全文”的超級鏈接,查看該圖書全文。

③超星數字圖書館。通過超星數字圖書館查詢,在圖書快速搜索的檢索框中輸入書名《票據法》,可以搜索到題名中含有票據法的73條記錄,由於搜索的結果比較多,讀者可以選擇使用高級檢索項,輸入書名、作者、出版社等多條信息,以縮小檢索範圍。以下是部分檢索到的結果:

④浙大百萬冊數字圖書係統。在圖書檢索框中輸入“票據法”,在下麵的複選框中選擇“現代圖書”選項,點擊檢索,得到檢索結果如下:

在此數據庫中共檢索到關於“票據法”的圖書80冊,檢索出的結果比較多,讀者也可以采用在高級檢索中限製檢索的範圍,得到精確的結果。在如下圖所示的選項中輸入所需的檢索詞,以及檢索詞之間的關係,就可檢索到相對精確的圖書。

⑤讀秀學術搜索。通過讀秀學術搜索可以搜索圖書、期刊、報紙、學位論文、會議論文等電子文獻。其搜索的部分圖書可以直接獲取圖書全文,其他則隻可得到部分內容或該書的圖書館收錄情況,此時讀者需要和相應圖書館的相關人員聯係,得到進一步的數據。通過讀秀學術搜索係統搜索關於“票據法”的圖書,可以搜索到圖書2792種,搜索結果如下:

在如此巨大的檢索結果中,篩選有用的信息猶如大海撈針,因此讀者可以采用高級檢索項,輸入具體的書名、責任者和主題詞等選項限製檢索的結果,縮小檢索範圍,以便快捷地查詢到所要查找的圖書。其高級檢索頁麵如下:

根據剛才檢索的結果,以及每個數據庫的收錄範圍,讀者可以看到方正Apabi數字圖書係統與書生之家檢索到的圖書比較少。相比之下超星數字圖書館與百萬冊數字圖書係統收錄的法律圖書比較全麵,讀秀學術搜索係統檢索到的圖書則相對較多。因此,讀者在檢索時應該選擇合適的數據庫,以便全麵快捷地找到所要的資料。

2.法學論文的檢索

在CNKI中國知網、維普期刊、萬方數據庫、超星數字圖書館、讀秀學術搜索、人大複印資料數據庫、書生之家及百萬冊數字圖書資源等數據庫都收錄有大量的學術論文與學位論文。這部分的具體內容與數據庫的使用在第五章將有詳細介紹,在此不再贅述。

(二)法律法規的檢索

法律法規一般分布在公報、法律彙編以及官方網站,這些信息可以到圖書館查詢,或到相關官方網站查詢。此外,有些數據庫和非官方網站也收錄有大量的法律法規文獻。

1.法律法規的數據庫和網站檢索

(1)中國年鑒資源全文數據庫。該數據庫是由北京方正阿帕比技術有限公司與中國出版工作者協會年鑒工作委員會共同發起,得到全國年鑒界公認並積極參與的中國主流專業的年鑒全文數據庫。數據庫所收錄年鑒資源覆蓋了我國國民經濟及社會發展的各個領域和地區,已形成較權威的綜合反映我國國情的信息資源體係。可在此搜索法律年鑒(如《中國法律年鑒》、《中國知識產權年鑒》等)所收錄的法律信息。