數字化科研環境下的學術交流研究
信息社會環境下的科技傳播實踐與理論創新
作者:趙康
摘要本文通過考察數字化科研環境下的學術交流研究,總結了近年來在科研環境影響下值得關注的學術交流研究議題,逐一闡述在數據管理、協同科研、學術社群行為變化以及信息機構學術交流服務創新等方麵的研究進展和進一步探討的方向,並對相關研究的主要理論視角及研究方法進行回顧。
關鍵詞數字化科研;學術交流;研究進展;理論視角;研究方法
中圖分類號G206.2 文獻標識碼A 文章編號 1674-6708(2013)107-0255-08
0引言
學術交流是科研研究的重要組成部分,是科學研究的本質[1]。學術交流一直是圖書館情報學學者關注的研究領域,它經曆了兩個快速發展階段。
第一個階段是1960-1970年,隨著科技事業的發展,科學交流理論研究取得大量成果。
第二個階段是1995年以後,信息與通訊技術(ICT)給學術交流環境帶來巨大變化,產生大量新交流模式應用的研究。如今,隨著科學研究進入e-Science時代,電子郵件、互聯網、協同編輯、電子出版、數字圖書館等服務被普遍采用,傳統學術交流模式正在向一個使用互聯網寫作、評議、注釋和修改的持續過程轉變[2]。
e-Science代表越來越多地依靠互聯網支持、全球分布式協同進行的大規模科學活動[3]。
其典型特征為:支持大規模計算,支持海量數據的存儲和處理,支持研究者間無縫協同工作。美國國家科學基金會(NSF)藍帶顧問小組稱其為Cyberinfrastructure(以下簡稱CI)。CI可以構建新型的科學與工程知識環境及組織,並以新的方式進行更有效的研究工作,形成協同、跨學科、開放共享的知識環境。
這樣的科研模式被稱為e-research 或者digital scholarship,這種說法表明它不僅僅限於科學工程領域。在人文及社會科學領域CI規劃方麵,美國學術團體學會(American Council of Learned Societies)已提出發展數字化學術研究的框架。
基於上述科研模式,發展出一種新的學術交流模式——Cyberscholarship,它具有很強的信息和數據存儲及處理能力,支持研究數據的可視化展示,以及交互式數據調查[4]。這意味著學術交流的未來麵臨巨大的機會,可能的變革成為學術界熱衷探討的議題。
2007年8月,CTwatch季刊發表一期主題為“即將到來的學術交流和CI革命”專刊,對CI影響下學術交流的變化進行了討論。2011年微軟研究院同哈佛大學共同舉辦“eScience——變革學術交流”研討會,探討博客、軟件、數據集等數字內容對學術交流的影響以及學術評價的新模式。
針對上述趨勢,我國學者賴茂生指出,知識生產方式的轉變,日趨重要的基於數據的科學和協同研究環境,以及學術交流模式的變革,使圖書館情報學麵臨新的挑戰。為科學交流提供支撐和服務,是圖書館情報學不變的使命[5]。
張曉林認為,當前和未來科技創新需要科研數據管理和基於知識的交互協同創造能力,圖書館服務應抓住機遇,建立支持戰略性知識需求的新型知識服務範式,建立支持合作創新群組學習和交互傳播的協同知識服務能力[6]。
孫坦等指出,基於Web 2.0 的新型學術交流機製的建立,跨界融合知識服務環境的構建與實現以及交互式智能化知識組織、檢索與發現技術的發展等,將進一步促進圖書情報機構信息服務的分化與融合[7]。
可見,數字化科研對學術交流帶來的影響以及可能產生的變革,為學術研究學者帶來更多值得關注的議題。
1主要研究議題
2007年,美國大學及研究圖書館協會(ACRL)曾通過專家研討會的形式總結出網絡環境下學術交流的八個研究議題,包括:
1)CI建設及影響;
2)組織模式的變化(如虛擬組織);
3)研究者信息行為的變化;
4)學術出版研究;
5)學術交流價值評估;
6)成功的知識創新;
7)信息和數據的保存;
8)公共政策和法律問題。
數字化科研基礎設施對學術交流的影響從報告的探討中可見一斑 [8]。本節選擇幾個主要研究議題闡述其進展。
1.1數據管理及數據共享研究
當前全球都在加大對科學數據的投資,數據成為科學研究交流和實踐的重要部分[9]。
2012年3月,奧巴馬政府發布大數據計劃,目標是通過提高從大型複雜的數字數據集中提取知識和觀點的能力,幫助加快科學與工程的步伐,加強國家安全,並改變教學研究。數據的重要性在某些研究領域甚至已經超過文獻。
但數據對象更加複雜:可能具有異構類型,在研究過程和產出中以不同形式出現,傳播途徑也更加多元化。數據的重要性及複雜性增加了數據實踐研究的難度,如何像使用文獻一樣重用和分析數據是學術界需要解決的問題。
數據密集型的科學發現成為當前科學研究的主導模式,科學研究進入第四範式。這種範式轉移需要更加有效的數據管理模式,機器友好的科學交流係統以及數據政策的支持[10]。微軟研究院的報告指出,科學數據管理是未來科學研究範式的重要部分,包括數據獲取、整合、處理和長期保存[11]。
數據的重要性催生了一個新的研究領域——數據管理(Data Curation)。它指對數據整個生命周期主動和持續的管理,使其在科學研究和教育中發揮作用。
數據管理工作,要確保數據的高質量和支持研究數據的存檔,並形成規範的數據管理機製[12]。
數據的長期保存和重複利用是數據管理的重要方麵,需要解決元數據、數據格式、互操作、訪問控製等問題。要明確負責儲存、管理數據並供長期使用的機構、職責及其管理模式,推動數據共享,防止數據濫用。
有效的數據管理是個係統工程,技術方麵,需要工具、方法以及數據標準的支持;經濟方麵,需要形成經濟上可持續的數字生態係統;社會方麵,圖書館等信息機構需要重新定位職責和角色;法律方麵,需要新的框架保護數字內容的歸屬權。
英國聯合信息係統委員會(JISC)的報告指出數據保存中心、圖書館、數字機構庫在數據保存方麵的角色,以及未來數據保存的任務、問題及策略[13]。
其數據管理中心(Digital Curation Centre)項目,建立了數據管理模型,對數據長期保存和應用機製提出對策[14]。Jim Gray等通過一項Sloan Digital Shy Survey案例研究,提出在確定要保存的數據內容、承擔保存和管理職責的機構、實現數據訪問、管理和長期保存等方麵的對策[15]。
Cragin對神經科學數據集合的案例研究發現,共享的科學數據集作為科學記錄的一部分,對於科學生產和學術交流具有重要影響,並指出研究圖書館對數據管理的重要性[16]。
如今,天文學、地球科學、環境科學、分子生物學等領域產生了大規模的基礎數據,需要有效的數據共享機製來支持數據的重用。促進數據共享成為未來學術交流係統的重要任務,但卻麵臨諸多障礙。
Borgman對不同學科領域的數據共享實踐進行研究,發現科學家在數據重用和共享方麵缺乏激勵[17]。數據共享實踐受到研究方法、數據特征、科學家個人經驗和控製研究工作傳播的需求等因素影響,對數據濫用的擔心會阻礙數據共享[16]。Karasti等通過考察生態學研究網絡的數據實踐,發現研究項目資助機構的強製性要求是促進數據共享的一個重要因素,但是,研究者在數據處理工作上耗費的額外時間降低了他們的積極性。
因此,需要恰當的獎勵製度和社群文化的支持[18]。Palmer認為,數據管理的最大困難在於收集和管理數據的成本和勞動力。即使在數據可獲得的情況下也缺乏一致的格式和清晰的元數據。
數字化科研環境下的學術交流係統需要具有良好的數據管理能力和數據共享機製。為此,研究者要準確了解數據在整個科研周期中的使用情況,探索學術交流係統支持數據實踐的機製。
1.2協同科研及虛擬組織研究
CI中心的協同科研功能被科學社會學家和計算機支持的協同工作(Computer-supported cooperative work, CSCW)研究者所關注。協同科研環境被稱為虛擬科研環境(Virtual Research Environment, VRE),包括一係列在線工具及其他互操作網絡資源和技術,用以支持或加強學科內部、跨學科或跨機構廣泛研究者的研究過程[19]。
協同實驗室(Collaboratory)是典型的協同科研環境,研究者可以不受物理位置的限製,和同行交互,訪問儀器設備、共享數據和計算資源,以及訪問信息和數字圖書館[20]。
協同科研環境打破了分布式研究團隊在信息交流、資源共享方麵的技術障礙。在科學社群中,成員的孤立通常與低生產率相聯係[21]。協同科研功能通過支持本地或異地資源及基礎設施的使用,加強了科學社群的聯係,從而能夠提高科學生產率。
但是,研究團隊的協同可能存在組織結構方麵的障礙。Pepe指出,CI規劃構建了科學組織的新形式,傳統組織形式和工作實踐嵌入新的社會技術背景中,出現複合組織形態[22]。這種形態屬於虛擬組織,需要以信息交流和共享為基礎,形成有效的協同機製。研究表明,在計算機支持的協同研究(Computer-supported cooperative research)中,要明確形成有效協同研究環境的必要和充分條件,其中,人的因素比技術因素更加重要[23]。對於協同實驗室來說,它屬於複雜係統,由大量互相交互的部件構成,構成的集合體不是各個獨立個體的簡單疊加[24]。
Cogburn認為,協同實驗室遠不是複雜ICT的集合,它是新的網絡組織形式,包括社會過程,協同技術,正式和非正式交流,以及在規範、原則、價值和規則上達成的協議[25]。
在虛擬組織中,信任、完整性和身份認證是有效協同的重要基礎。傳統學術出版模式的成功在於滿足了學術社群的核心需求並體現出社群共享的信任模式[26]。虛擬組織共享的社群規範和認知文化,是協同科研的重要支持[17]。
然而,跨學科、跨地域的協同研究者之間容易缺乏理解和信任。虛擬環境的交流存在缺乏共同背景(Common Ground)的風險,為達到共同背景交流中需要傳遞更多的信息。Olson認為,即使技術上具備協同科研的可能性,地域對合作關係的影響依然存在,距離的增加會減少合作的可能性[27]。
電子郵件、視頻及音頻會議、協同編輯工具等並不是相同地理位置的充分替代,不充分的係統設計也可能導致無法滿足研究者的實踐需要[28]。
上述問題給協同科研帶來了諸多挑戰和新問題。隨著協同科研實踐的發展,要進一步明確支持虛擬組織有效協同的社會、人員和組織安排機製,了解虛擬組織結構中信息共享和保存的方式,以及不同機構在支持學術交流上的新職責。
1.3學術社群行為及需求研究
學術社群是科研實踐的執行者和學術交流服務的使用者,其交流方式受到科研環境的影響,同時也具有影響學術交流體係變化的能力。數字化給學術社群的行為帶來諸多變化。在科學研究過程形成的信息周期中,研究者討論、撰寫、分享和查詢信息都通過網絡化的信息係統實現[29]。學術博客、郵件組、視頻會議、協作工具、數據共享和分析工具等提供了廣泛的信息交流平台。
Google Scholar、Citeseer、Scopus等開放式的學術資源檢索工具成為信息獲取的重要渠道。arXiv、DOAJ、PLoS等開放獲取期刊和機構庫平台,是發表和獲取學術成果的多樣化途徑。Zotero、Mendeley和Endnote等文獻組織工具以及Connotea、CiteUlike等社會標簽工具的使用,成為學術資源分類和共享的新模式。
ICT應用給學術社群科學研究過程帶來積極影響。認識這種影響和學術社群的需求是開發新基礎設施的前提。Walsh等人通過對333名科學家使用email的行為調查和統計分析,表明機媒交流對科學家的合作和生產率都有積極的影響[30]。