基於語料庫的《經濟學人》中文本的詞塊分析
經濟研究
作者:李甜
【摘要】隨著認知學研究的發展,單詞不再是語言信息處理的唯一單位,在語言理解和語言產出中存在著詞塊這樣一種理想的單位。從20世紀80年代至今,隨著語料庫語言學的發展,人們能夠更加客觀的認識語言。人們發現,在人的大腦中儲藏著很多固定化或半固定化的語言結構,這些結構兼有句法和詞彙的雙重特征。這些詞塊不僅在語言的習得中扮演著重要的角色,而且幫助人們更簡單,流利地產出語言。因此對自然語言中詞塊的使用進行研究是具有價值的。《經濟學人》中的文章常常被用於大學生英語考試的閱讀的初始材料。研究《經濟學人》中文本的詞塊特征對英語考試閱讀能力的提高有著重要的作用。在以往的研究中,有不少對大學生英語考試中的作文詞塊的研究,對英語考試中閱讀材料的初始材料的詞塊的研究是比較少的。因此,這篇論文試圖建立一個關於《經濟學人》文章中語塊的微型語料庫。借助於Antconc軟件提取一些36詞的詞塊。按照一定的標準進行人工篩選確定詞塊。根據Altenberg的分類標準,將語塊的結構分為完整分句,分句成分和不完全詞組3個類別。研究結果表明詞塊的長度和詞塊出現的頻率成反比。3種詞塊類型中分句成分所占比例最大,而完整分句所占比例最小。
【關鍵詞】詞塊;語料庫;閱讀理解
引言
20世紀80年代以來,大型計算機語料庫的豐富發展給語言學家們提供了一個研究自然語言的新發展。人類語言中存在著大量的固定化和半固定化的表達結構。它們儲藏在人類大腦中供提取和運用。大約70%的口語都是由詞塊產生的。詞塊的存在加快了語言處理的速度,對語言習得和語言輸出的流利性和地道性都具有重大的意義。因此,近年來,在語言使用中對於詞塊的研究更為廣泛。許多前人的研究都主要是理論化的研究,對多詞語集合的不同視角研究進行對比,提出一些新的分析方法模式。Weinert 確定了兩種基本的研究問題:確定固定的詞語集合,分析其語篇功能。對這兩類研究問題出現了大量的實證研究。然而對如何定義這些多詞語集合,用什麼樣的方法來研究它們,卻很少達到一致。
《經濟學人》中的文章常被用於編寫大學英語考試的閱讀理解部分。因此了解這其中的一些常用的詞塊能夠提高學生的閱讀理解能力。對於閱讀理解原始材料的語料庫相關的研究比較少見。論文試圖建立一個語料庫,通過Antconc軟件提取一些不同長度的詞塊,分析他們的結構和語用特征。借此希望通過提高學生對詞塊的了解來提高學生閱讀理解的能力。
1 文獻綜述
1.1國外的研究
Becker(1975)是第一個較詳盡地研究詞塊的人,他認為那些固定的或半固定的語言表達結構的人類語言交際的最小單位。他還認為日常的語言使用應該被作為語言研究的一個主題。在以後的研究中,詞塊被冠以不同的名稱,例如:chunk,Lexical phrase,lexical bundles 等等。Lexical phrase這個詞被Nattinger和DeCarrio(1992)運用到很多研究中,他們認為語言產出的過程就是“對這些預製語塊進行選擇,然後將這些語塊串聯起來的過程。”Michael Lewis(1997)把詞塊分為四種類型:1)複合詞和集合詞2)搭配3)慣用語4)句子框架和引語。他認為語塊是可以被觀察的現象而且常常出現在自然的語篇中。
Altengberg(1993)認為詞塊是以同一種形式出現超過一次的連續的詞語。他根據詞塊的結構特點,把詞塊分為三大類:完整分句、分句成分和不完全詞組。完整分句具有相對完整的句子結構和語法意義,包括獨立分句和從屬分句兩類。獨立分句作為一個完整的句子可以單獨使用表達完整的語義,如Haste makes waste從屬分句不能單獨成句,隻能插於句中,與其他分句共同組成一個完整的句子,如as far as I’m concerned.分句成分在所有詞塊中所占的比例最大,又分為多種分句成分與單一分句成分兩種。一個多種分句成分詞塊中包含兩個或多個句子成分,如I think中含有句子的主語和謂語;相反,單一分句成分僅充當句子的一個成分,如in the past作為時間狀語。
Biber(1999)把詞塊定義為“在自然語篇中有一種同現趨勢的三次或多詞序列。”根據他的理論,詞塊的語法功能和它們的許多基本結構類型有很強的聯係。Biber(2007)論述了大學英語不同口語及書麵語語體中的詞塊用法。
1.2國內的研究
隨著基於語料庫的研究方法傳入中國,濮建忠(2003)基於中國學習者英語語料庫(CLEL)和布朗語料庫,對中國學習者使用語塊進行了一個對比研究。研究結果顯示中國學習者在語言輸出中使用語塊的意識相較本族語使用者要弱。王立非(2006)基於中國學習者筆語語料庫(WECCL)對英語學生在議論文中使用詞塊進行了研究,發現中國學生使用的語塊類型很少,而且還過度的使用三次語塊。衛乃興(2007)根據Altenberg對詞塊的分類,對中國學生口語語料庫(COLSEC)中的詞塊進行了研究。研究結果表明中國的學習者傾向於使用不同的詞塊來表達既定的意義和功能,中國學習者的中介語在既定的情境下形成了自身實現語用意義的方法。