信息學方法論精裝-第五章引文分析方法概述

（2）文獻被引用並不完全等於重要：例如，有些具有錯誤觀點或結論的論文，後人出於批評商榷，被引次數可能很多。另一方麵，被引次數較少的文獻也不能一概認為不重要。它受到許多因素的限製，如發表的時間、語種、學科專業等等。被引次數上的微小差別也不能完全說明質量上的優劣，它有很大的隨機性，隻有當這一差別很大時，才能說明問題。

（3）著者選用引文受到可獲得性的影響：索普（M.E.Soper）研究指出，著者引用的文獻，大部分是個人收藏的文獻；少部分是本部門和就近圖書館的資料，而其它城市或其它國家的文獻所占比例甚小。這說明著者選用參考文獻以方便為準則，以占有為前提；同時還要受到著者語言能力、文獻本身年齡和流通周期，以及二次出版物報道的影響。

（4）馬太效應的影響：有的研究者認為，在文獻引用方麵也存在著馬太效應的影響。人們往往以"名著"、"權威"作為選擇引文的標準，有的確是出於需要，也有的則是為了裝飾門麵，抬高自己論文的身價。一種期刊因為發表名人的文章而為眾人所引用，以至引起連鎖反應，結果其引文率很高。這種馬太效應的心理作用，掩蓋和影響著文獻引用的真實性。

三、引文分析方法的使用範圍

（一）引文分析方法的測度指標

一般來說，對科學期刊進行分析時常用的測度指標有五種：即自引率、被自引率、影響因子、引證率與當年指標。在對專業和學科結構進行研究時，除用引證率外，還可用引文耦合和同被引等測度指標。

1.自引率：在引用文獻的過程中，限於主體本身範圍內的引用稱之為"自引"。包括同一類學科文獻的自引、同一期刊文獻的自引、同一著者文獻的自引、同一機構文獻的自引、同一種文獻的自引、同一時期文獻的自引、同一地區文獻的自引。自引率就是對主體本身範圍內文獻引用的次數與主體引用的文獻總數的比值。

2.被自引率：這是被引用現象的一個測度，被自引率就是主體文獻被自引的次數與主體被引用的總次數的比值。它反映出被引用中有多少是被自己引用的。

3.影響因子：主要在研究科技期刊時使用，等於期刊在規定時間內（一般是兩年）論文被引量與可引論文總數之比。

4.引證率：期刊引證率等於該刊中參考文獻量除以期刊載文量。這是衡量吸收文獻能力的一個相對指標。

5.即時指標：這是測度期刊被引用速度的指標，它是期刊某年發表的論文當年被引用的次數，除以該刊這一年所發表文章的總數，是衡量期刊重要性的一種依據。

6.引文耦合：當兩篇文章同時引用一篇或多篇相同的文獻時，這種現象稱引文耦合，這兩篇文獻就具有耦合關係。引文耦合的文獻之間總存在著這樣或那樣的聯係，其聯係的程度稱為耦合強度。

7.同被引：當兩篇（多篇）論文同時被別的論文引用時，則稱這兩篇論文具有"同被引"關係，引用它們的論文的多少，即同被引程度，稱為同被引強度。

（二）引文分析方法的應用領域

目前，引文分析技術日趨完善，應用不斷擴大，已發展成為文獻計量學的重要方法之一。引文分析方法的應用主要有以下幾個方麵：

1.測定學科的影響和重要性：通過文獻引用頻率的分析研究可以測定某一學科的影響和某一國家某些學科的重要性。

2.研究學科結構：通過引文聚類分析，特別是從引文間的網狀關係進行研究，能夠探明有關學科之間的親緣關係和結構，劃定某學科的作者集體；分析推測學科間的交叉、滲透和衍生趨勢；還能對某一學科的產生背景、發展概貌、突破性成就、相互滲透和今後發展方向進行分析，從而揭示科學的動態結構和某些發展規律。1974年，加菲爾德運用計算機係統，通過引文分析，描繪出1972年和1973年生物醫學領域各主要課題、各課題相互間的關係以及新課題產生的示意圖，從而反映出生物醫學研究的內部結構。

3.研究學科信息源分布：通過文獻間的相互引證關係，分析某學科（或專業）文獻的參考文獻的來源和學科特性，不僅可以了解該學科與哪些學科有聯係，而且還能探明其信息的來源及分布特征，從而為製定本學科的信息管理方案和發展規劃提供依據。

4.確定核心期刊：引文分析方法是確定核心期刊的常用方法之一。這種方法的主要特點，是從文獻被利用的角度來評價和選擇期刊的，比較客觀。加菲爾德通過引文分析，研究了文獻的聚類規律。他將期刊按照期刊引用率的次序排列，發現每門學科的文獻都包含有其它學科的核心文獻。這樣，所有學科的文獻加在一起就可構成一個整體的、多學科的核心文獻，而刊載這些核心文獻的期刊不過1000種左右。利用期刊引文的這種集中性規律可以確定學科的核心期刊。

5.研究文獻老化規律：目前，有關文獻老化的研究一般是從文獻被利用角度出發的。D.普賴斯曾利用引文分析探討文獻的老化規律。通過對"當年指標"和"期刊平均引用率"的分析，他認為期刊論文是由半衰期絕然不同的兩大類文獻構成的，即檔案性文獻和有現時作用的文獻。科學文獻之間引文關係的一種基本形式是引文的時間序列。對引文的年代分布曲線進行分析，可以測定各學科期刊的"半衰期"和"最大引文年限"，從而為製定文獻的最佳收藏年限、對文獻利用進行定量分析提供依據。同時，一個學科的引文年代分布曲線與其老化曲線極為相似。這有力地說明文獻引文分布反映了文獻老化的規律性。因此，從文獻引用的角度研究文獻老化規律是一種有效的途徑和方法。

6.研究信息用戶的需求特點：利用引文分析方法進行信息用戶研究是一種重要途徑。根據科學文獻的引文可以研究用戶的信息需求特點。一般來說，附在論文末尾的被引用文獻是用戶（作者）所需要和利用的最有代表性的文獻。因此，引文的特點可基本反映出用戶利用正式渠道獲得信息的主要特點，尤其是某信息中心對其所服務的用戶所發表的論文的引文分析，更具有直接的指導意義。通過對同一專業的用戶所發表的論文的大量引文統計，可以獲得與信息需求有關的許多指標，如引文數量、引文的文獻類型、引文的語種分布、引文的時間分布、引文出處等。

7.評價人才：在人才評價方麵，常采用引文分析方法。這是因為某著者的論文被別人引用的程度可以是衡量該論文學術價值和影響的一種測度，同時，也從科研成果被利用的角度反映了該著者在本學科領域內的影響和地位。因此，引文數據為人才評價提供了定量依據。從對曆年諾貝爾獎金獲得者的論文被引用情況的統計來看，物理學、化學、醫學領域中諾貝爾獎金獲得者中，其論文被引次數最高者（L.D.Landan）為1888次；最低的也有79次（J· H· D· Jensen）；隻有六名低於 200次。可見，這些科學界的精英的論文的引用次數是很高的。