正文 第10章 詩歌與統計(1 / 2)

初唐時期有一位著名的詩僧叫做寒山和尚。張繼的名作《楓橋夜泊》:月落烏啼霜滿天,江楓漁火對愁眠。

姑蘇城外寒山寺,夜半鍾聲到客船。

其中的寒山寺就是因寒山和尚曾在那裏住過而得名的。

寒山和尚寫過許多詩,有不少詩還是關於社會問題的。不過他的詩不是寫在紙上,而是到處題詠,或山岩,或石壁,東一首,西一首,別人根本無法統計,但他自己卻心中有數:五言五百篇,七言七十九,三字二十一,都來六百首。

這是一首詩,也是一份統計表。是用統計數字組成的詩,也是用詩來表達的統計表。

大概是善於運用統計的緣故吧,這位處於初唐盛世的寒山和尚,竟然已經注意到了人口問題。他認為,人口的盲目增長是造成資源匱乏,生活貧困的原因。他在一首詩中寫道:我見一癡漢,仍居三兩婦。

養得八九兒,總是隨宜手。

丁戶是新差,資財非舊有。

黃蘖作驢鞧,始知苦在後。

(黃蘖是一種皮很苦的植物,驢鞧是栓在驢屁股後麵的皮套)。這首詩用通俗淺顯的語言指出了三個問題:第一,一個智力低下的人,卻娶兩三個老婆,生八九個兒女(基本符合統計規律),這不是什麼福氣,徒使人口增加。第二,人口一多,開支增大,又不會節約,原有的一點家財很快花光,成為窮光蛋。第三,智力低下又家境貧窮,人口眾多,往後的日子就苦了。寒山和尚還極力主張少生優育。他寫道:“生女畏太多,已生須訓誘。”“養子不經師,不及都亭鼠。”認為生男育女切忌太多,既已生了就必須給予良好的教育,養子女不教育還不如一隻老鼠。所有這些,沒有一點統計學的頭腦,恐怕是寫不出來的。寒山和尚開了詩歌與統計結緣的先河。

其實,文學作品與統計的關係,遠遠不止在統計作品的數量,另外還有很深的緣分。每位詩人或作家都有自己的風格,除了作品的內容以外,遣詞造句的習慣等語言特征也形成作品風格的重要特征。這種風格在數量上的表現就是人們各自的語言特點在統計上的差異。1964年,謝德洛夫提出了“計算風格學”,它是以計算機為工具,對不同的作者的風格進行統計分析、計算、整理的一門學科。下麵的兩個例子,將使我們看到文學作品與統計的關係。

(一)抒情詩統計律

一首好的抒情詩,除了在內容上應給人以美的感受外,還應當使讀者易於記憶,易於背誦。在中國,為什麼五言和七言的舊體詩至今仍為人們所喜聞樂見?在西方,為什麼“十四行詩”從文藝複興時代一直延續到現在?其原因固然是多方麵的,但是,它們都易於背誦也是一個原因。什麼樣的詩才易於記憶,易於背誦呢?實驗表明,人們短時間記憶通常隻能記住5個組塊。組塊是信息量的一個單位,是測量人的短時間記憶的最小單位。多大的信息量算一個組塊呢?這並不是固定不變的。一個數字、一個公式、一個符號、一句成語都可能成為一個組塊。如果一首詩少於5段、一段少於5行,一行少於5頓,一頓少於5字,從記憶規律看,就很容易記住。如果一首詩段數太多,句子太長,大大地超過了5個組塊,就會給背誦帶來困難。例如舊體詩中的七言絕句是2句、4行、每行4頓。七言律詩是4句,8行,每行4頓。以前麵提到的《楓橋夜泊》為例:月落/烏啼/霜/滿天,江楓/漁火/對愁/眠。

姑蘇/城外/寒山/寺,

夜半/鍾聲/到/客船。

這首詩的段數,每段句數,每段行數,每行頓數,每頓字數都小於5,所以便於記憶和背誦。

一首抒情詩要使人們易於背誦,應當采用什麼形式為好?有人提出了以一首詩的平均組塊數為標準的“抒情詩統計律”:S=14(A+B+C+D)≤5