3.研究設計
3.1研究對象。
以聯合國糧食及農業組織(Food and Agriculture Organization of the United Nations)官方網站上的涉農新聞報道為文本來源建設FAO農業英語語料庫,文本選自於2008年至2013年的農業新聞報道,涉及農業、畜牧業、生物科技、食品安全等18個農業新聞主題,語料庫總量為234696個形符,共423篇。
聯合國糧食及農業組織是聯合國係統內最早的常設專門機構,其宗旨是提高人民的營養水平和生活標準,改進農產品的生產和分配,改善農村和農民的經濟狀況,促進世界經濟的發展並保證人類免於饑餓。其官方網站的新聞報道涉及麵廣,緊扣其工作重心,主要向全世界人民介紹當下的農業熱點和糧食問題、對於向欠發達地區推廣農業新技術和解決當地的糧食短缺問題起到重要的推動作用,如政府有關農業、農村、農民方麵的政策;農業生產實踐中的新發展、新發明、新成果;農業科研方麵的新問題、新進展及新經驗;農業科技戰線上傑出的人物、事跡等;農業新技術推廣的新辦法、新途徑、效果及社會效益等。
3.2技術支撐。
3.2.1清潔工具。借助PowerGrep等文本編輯工具中的查找功能,清潔收集到的語料,處理全角標點、全角字母和數字、全角空格、跳格、行尾和文中多餘空格、多餘空行等問題,保證語料文本由清潔文本構成,保證自動詞性賦碼的準確性,進而保證檢索結果的準確性(梁茂成,李文中,許家金,2010)。以往的MicrosoftWord雖然也能清潔文本,但是隻能處理單個文本,PowerGrep既可以處理單個文本,又可以進行批量處理。
3.2.2標注工具。一方麵,可以通過BFSU Qualitative Coder1.1語料庫軟件進行元信息的批量標注,對每篇文本的標題、發表時間、來源、作者、期刊名稱、發表時間、建庫人和組織信息等信息進行標注,以便使用者清楚地知道文本信息的信息,也便於應用者單文本的查找。另一方麵,為了對語料進行詞性和句法結構等方麵的深度研究,也為了對語料庫數據分析能夠更加係統精確,對特殊數據信息進行提取和處理,本研究擬對生文本語料進行詞語切分和詞性賦碼標注。經過比選,本語料庫的創建選用了比較成熟的Helmut Schmid設計的TreeTagger詞性賦碼軟件,TreeTagger詞性賦碼軟件可以根據概率的原則,用計算機進行自動化處理,是目前最權威的英語語料賦碼軟件之一。將清潔文本用Treetagger進行詞性標注,標注後的文本可以進行微觀的詞彙研究,通過檢索軟件可以得到相應的形成名詞詞表、動詞詞表等。
3.2.3重命名工具。由於文本處理過程中運用到了詞性標注軟件,詞性標注軟件在對文本進行詞性標注的同時,對文本的域名也進行了批量改寫,域名從原來的“.txt”改為了“.txt.pos”。因此必須運用重命名軟件將域名改回原來的“.txt”,才能被接下來的檢索軟件識別。因此,本研究可以利用Super Batch Renamer語料庫軟件進行批量改名。
3.2.4檢索工具。日本早稻田大學Laurence Anthony設計的Antconc,許家金和賈雲龍(2013)研製開發的PowerConc軟件,英國利物浦大學Mike Barlow設計的Word smith Tools,北京外國語大學中國外語教育研究中心設計的PatCount等語料庫軟件,都可以進行單詞或者多詞的檢索,包含詞彙索引、詞表生成、主題詞計算等功能,這樣就為農業科學學術英語的高頻詞進行量化分析提供了充分的技術保障,尤其是近來,許家金和賈雲龍(2013)又研製開發了PowerConc軟件,PowerConc對傳統的詞彙索引、詞表生成、主題詞計算等功能進行了重構、擴展和優化,正則表達式(regular expressions)的N元組(N-gram)為基礎二者的有機結合,功能強大,為我們利用正則表達式檢索被動語態和名物化的形式提供了強有力的技術支撐。此外,還有BFSUCollocator搭配分析軟件,BFSUcolligator類連接分析專用工具,SPSS,Excel等統計分析工具,都具有免費使用、功能強大、準確率高等特點,都為本研究提供了技術支撐,能夠保證本語料庫的建設和研究順利完成。
同時,國內已經有建成的眾多與專業英語相結合的專門用途英語語料庫和學術英語語料庫,如航空航天英語語料庫、醫學英語語料庫、旅遊英語語料庫、商務英語語料庫,這些語料庫的建立及其研究成果,都給建設農業科學學術英語語料庫提供了研究方法上的寶貴借鑒。
4. FAO農業英語語料庫在農業英語教學中的價值
4.1完善專門用途英語語料庫的建設,促進教學改革。
建立國內首個FAO農業英語語料庫,改變農業英語專用語料庫發展滯後的現狀,完善專門用途英語語料庫的建設,為今後建立大規模農業英語語料庫提供範例。語料庫可以提供大量可靠性高的參照數據和新鮮實例,使語言研究更具概括性和說服力,將給以往的教學材料帶來衝擊,為今後農業英語教學提供直接的、可操作的、可靠性強的素材;FAO農業英語語料庫將提供基於語料庫的農業科技英語詞典編撰、基於語料庫和計算機的多媒體課件開發等,傳統的編寫方式比較固定,大多是依靠他人資料和個人經驗編寫而成,而自語料庫出現之後,教材的編寫處於新的形勢,這將幫助教授農業英語的英語專業教師更好地向專門用途英語教師方向轉變,促進專門用途英語教學改革(蔡基剛,2004)。