現在,日本除了各個大學的紀要可以刊登漢日語言對比研究的文章外,“日中言語研究と日本語教育研究會”的會刊『日中言語研究と日本語教育』和“日中對比語言學學會”的會刊『日中言語対照研究論集』主要以刊登漢日語言對比研究的文章為主。
下麵舉兩個小例子來談談我個人對漢日語言對比研究課題的理解。
比如,在動詞研究中,意誌動詞和非意誌動詞的研究一直是關心的焦點。這裏的意誌動詞和非意誌動詞應該指的是可以用來表達意誌和不能用來表達意誌的動詞。使用動詞來表達意誌或不表意誌應該是一個泛語言的現象。日語裏有,漢語裏也有。在使用動詞表達意誌或不表意誌時,從邏輯上講,會有3種情況。一種是隻能用來表達意誌而不能用於表非意誌的動詞,一種是隻能用來表非意誌而不能用於表意誌的動詞,一種是既可以用於表意誌也可以用於表非意誌的動詞。漢語第1種動詞在日語中可能也屬於第1種動詞,也可能是第2種或第3種動詞。而且,漢語第1種當中的某一類動詞的下位語義在日語中有的可能屬於第1種動詞,有的可能屬於第2種或第3種動詞。反之亦然。如果從描寫語法出發,首先需要描寫清楚上述漢語和日語中對應、不對應或部分對應的語言事實,然後去尋找造成對應、不對應或部分對應產生的原因,最後抽取漢語和日語使用動詞表達意誌或非意誌的最基本的語言選擇和語言表達的機製,以此探索漢日兩種語言中使用動詞表達意誌或非意誌時的共性。從上麵的表述中可以看出,就意誌動詞和非意誌動詞的研究而論,這已經就是一個巨大的工程,不是一兩個人可以搞清楚的。也就是說,如果說現在的漢日語言對比研究還缺乏係統性和體係性,那麼漢日語言對比研究中所有研究領域的研究課題都是需要重新審視的,都是可以重新研究的。與其他語言研究相比,正因為這個研究領域還很年輕,所以,可供研究的空間非常大。
再舉一個與語言教學有關的小例子。如果你是一個大阪人,下周要去東京和京都。有個兩組表達方式可供選擇,一組是「①來週,東京へ行きます。」「②來週,東京に行きます。」,一組是「③來週,京都へ行きます。」「④來週,京都に行きます。」。日語除了格助詞「に」和「へ」的選擇不同外,從語法意義上講,這兩組的語法功能和表義功能是一樣的,用漢語來表達的話都是“下周去東京。”和“下周去京都。”。於是有的人就在「に」和「へ」上做文章,說「に」用來表終點,「へ」用來表方向,選擇表終點「に」時,目的地是終點,選擇表方向「へ」時,目的地未必是終點。可是,漢語的“下周去東京。”和“下周去京都。”就沒有這種區別,需要特別強調終點時,可以使用“到…去”結構,說成“下周到東京去。”。實際上,這種對比研究對日語教學和日語學習並沒有什麼幫助,因為事實並非如此。
室町時代有這麼一個成語,「京へ築紫に阪東さ」。說的是表動作方向時,京都人用「へ」,九州人用「に」,關東人用「さ」。也就是說,「に」和「へ」原先並非用來強調表終點處所和方向處所的,隻是一種地域的差異而已。在上了年歲的京都人和九州人當中有的時候還能觀察到這種痕跡,當然,關東人已經不用「さ」來表方向處所了。
山下秀雄(1986)在『日本のことばとこころ』中談到「に」「から」「で」的區別時,認為選擇使用哪個格助詞,要受到人際關係的影響。比如,「あの人に招待券をもらった。」和「あの人から招待券をもらった。」都是可以成立的。但是,雖然「に」和「から」都用來表起點處所,但說話人與前句和後句中的「あの人」的關係不同。用「に」時表示說話人與「あの人」關係親密,用「から」時表示說話人與「あの人」關係疏遠。所以,在日語中,「市役所からもらった。」是十分自然的說法,而「市役所にもらった。」通常就不能成立了。也就是說,在表達起點處所時,用「に」還是用「から」不完全是由句法決定的,與人際關係表述有著十分重要的關係。如果說「から」裏還蘊含著些許人與人的關係的話,那麼「で」與人際關係就絲毫無關了。如「市役所でもらった。」所示,起點處所僅僅隻用來表處所。也就是說,在日語表達當中,「に」「から」「で」在表起點處所時,呈現出「に」→「から」→「で」的關係。左側的「に」不單單用來表起點處所,還與人際關係有著密切的關係,而右側的「で」就隻用來表達起點處所,而與人際關係無關。所以,當需要表達下周去東京或京都時,關西人特別是關西的年輕人最常用的表達方式是「來週,東京へ行きます。」和「來週,京都に行きます。」。用「に」和「から」來區別表達自己對東京和京都的感情。用「來週,京都に行きます。」來表明把京都看作是自己的家鄉或感情深的地方,用「來週,東京へ行きます。」來表明把東京看作與自己不太有關係的地方。神戶人中也有人說「京都へ行きます。」的,但他們在表達“去三宮。”時,絕大多數會說成「三宮に行きます。」。道理相同。
但是,中國人的理解就不同了。既然「もらう」這個動詞需要表起點處所的論元共現,而日語中用來表起點處所的格助詞通常是「から」或「より」,那麼中國人自然會首選「から」來表起點處所,而不會想到「に」的。因為,在日語教學中,「に」通常解釋為用來表終點或動作對方。如果不知道「に」和「から」的上述表人際關係的功能,很可能就會出現詞不達意或引起誤解的現象。雖然「市役所からもらった。」漢語可以用“從市政府那裏領的。”來表達,「市役所でもらった。」漢語可以用“在市政府那裏拿的。”,但這個漢語句子的表義功能並沒有什麼關鍵性的差別。而且,與「に」和「から」相對應的漢語介詞“從”“在”並不像日語那樣可以用來表人際關係。這說明漢語句子的句義實現與人際關係無關,而與此相反,日語句子的句義實現需要依賴於人際關係。
也就是說,日語的格助詞在表終點處所,方向處所,起點處所時,除了要受語法或句法的製約外,還有一個非常重要和不容忽視的因素,這就是還要受人際關係表達的製約。漢語不是黏著語,沒有日語的格助詞,但漢語中有介詞。日語中什麼樣的格助詞用來表達什麼樣的人際關係,當漢語的介詞與日語的格助詞相對應時,漢語是否也存在這樣的用法,如果有或沒有,那麼漢語是采用何種形式來表達的,像這樣的語言對比研究就顯得十分有意義了。因為,研究的結果可以直接貢獻於語言教學和語言學習。為語言教學和語言學習服務的語言對比研究,其目的是為了尋找加速掌握日語或漢語的最有效的方法,凡是可以達到這個目的的研究都是需要不斷持續和深入下去的。
上麵我們簡單地介紹了日本的漢日語言對比研究的現狀,涉及了漢日語言對比研究的熱點和對漢日語言對比研究的展望和期許這兩個問題。日本的漢日對比研究的現狀與國內相似,雖然出了一些好的專著和論文,但各個領域的研究都缺乏係統性和體係性,大都缺乏值得其他語言研究和語言學研究參考的深度。鑒於這種現狀,所有與從類型語言學角度出發,尋找語言中應該普遍存在的基本模式,以貢獻於與語言學研究相關聯的漢日語言對比研究的課題,以及尋找語言習得的機製,以貢獻於語言教學的漢日語言對比研究的課題都是熱點。未來的漢日語言對比研究的重點應該放在係統地研究每個課題上,蜻蜓點水和淺嚐輒止的研究不能解決問題,如何在係統性研究的基礎上加大研究深度也是十分重要的。另外,漢日語言對比研究中的語用對比研究在語言教學和語言學習中也顯得舉足輕重,但這個領域的研究依舊還需要有人認真地去拓荒。
二、關於語料的收集與分析
問:語料的收集與分析在論文的寫作過程中是不可缺少的。聽說於老師在語料庫建設和加注標簽上有獨到的研究,能否請您談一下怎樣收集語料以及怎樣對所收集的語料進行分析?
答:對於研究語言的人來說,特別是對於從描寫和分析中抽取規則的人來說,語料是生命線。沒有語料等於無米之炊。因此,收集語料和分析語料是語言研究的基本功,基本功做好了,下麵的文章就好做多了。我不敢說自己在語料庫建設方麵有什麼獨到的研究,也多半是借他山之石攻玉罷了。張威教授主編了一套方法工具與日語教學研究叢書,共有7本。《語料庫的製作與日語研究》、《漢日日漢翻譯語料庫的製作、應用與翻譯教學研究》、《加注標簽軟件的使用與日語、日語偏誤和翻譯教學研究》、《計量統計解析與日語研究》、《中國日語教材的計量解析與日語教材編寫》、《偏誤語料庫的製作、應用與中國學生的日語偏誤研究》、《日語複合動詞語義解析與教學方略研究》,並由浙江工商大學出版社於2013年開始陸續出版發行。2013年3月出版了我寫的《語料庫的製作與日語研究》,現在我正和我的博士生共同執筆《加注標簽軟件的使用與日語、日語偏誤和翻譯教學研究》和《漢日日漢翻譯語料庫的製作、應用與翻譯教學研究》,估計2014年可以與大家見麵。
《語料庫的製作與日語研究》共分6章,分別是“第1章語言資源的利用與語料庫建設”、“第2章電腦配置、所需軟件及軟件的安裝”、“第3章收集與保存語料”、“第4章清理語料”、“第5章製作語料庫”、“第6章給例句加注標簽與日語研究”,這本書詳細地介紹了從收集語料到製作語料庫的全部過程。特別是對如何收集語料做了十分詳盡的描述。除了具體地介紹了如何從網上直接下載和保存語料外,還詳細地介紹了如何從PDF文件中讀取和保存語料的方法。希望讀者可以去讀一下這本書,這裏就不再贅述了。
下麵我想主要談一下加注標簽的軟件。
過去我們製作的帶標簽的語料庫由於受版權等的限製無法自由地公開,而且讀者也無法自由和任意地增減標簽,隻能根據有限的語料來進行研究。這好像一個人被綁住了雙手去參加長跑比賽一樣,很不自由。因此,必須從根本上來解決這個問題。解決問題的方法就是設計、製作並免費公開加注標簽的軟件。這樣讀者可以使用加注標簽的軟件,根據自己研究的需要去增減標簽,並結合自己增減的標簽給例句加注標簽,然後使用加注標簽的語料設計並製作帶標簽的語料庫。為了順應大家的要求,我們設計並製作了7個軟件。其中包括3個加注標簽的軟件。即《日語語料庫專用的加注標簽軟件》、《偏誤語料庫專用的加注標簽軟件》和《翻譯語料庫專用的加注標簽軟件》。這7個軟件我們將免費提供給大家,提供的方式是用光盤的形式附在上述方法工具與日語教學研究叢書的有關書籍中。
在自己設計並給例句加注標簽時,為什麼要給例句加注標簽、標簽的種類如何考慮、設計和加注標簽的準則是什麼、何為比較合理的加注標簽的方式和標簽的內容等,都與可否有效地從標簽中抽取規則密切相關。下麵我們就來談談這幾個問題。
學會了製作語料庫並非大功告成,收集到了數以千計或數以萬計的例句也並非研究已見光明。還有一個非常關鍵和非常重要,同時也是非常令人頭痛的工作在等待著我們,這就是如何分析收集來的例句並從收集來的例句中找到研究的線索。
無論從事什麼樣的研究,基本上都有兩個方法。一個是歸納法,一個是演繹法。使用語料庫進行研究,基本是以歸納法為主。即從大量的例句中去歸納和發現規則或規律。問題是該如何去歸納和發現規則或規律。
比如,在20個人當中,隻有5個人是兄弟姐妹關係。這時,大家都會使用大腦這個工具,對20個人進行分類,然後進行各種各樣的排列組合,最後辨別出這5個人來。對20個人進行分類,依據的是區別特征。這些區別特征實際上就是一種標簽。20個人中的每一個人都會被標注上各種各樣的標簽,然後再對這些標簽反反複複地進行各種各樣的排列組合,最後找出具有相同特征的標簽,以此來認定具有兄弟姐妹關係的5個人。
由此可見,歸納和發現規則或規律的比較有效的方法是對研究對象加注各類標簽,通過對標簽的不斷分類和排列組合,剔除無用的信息,最後歸納出具有上位概念意義的特征來。這個特征就是具有能產性和具有普遍解釋意義的規則或規律。