其中的:A——代表一首詩的平均段數;
B——代表每段的平均句數;
C——代表每段的平均行數;
D——代表每句的平均頓數;
E——代表每頓的平均字數;
S——代表一首詩的平均組塊數。
由於在大多數情況下,E總是明顯地小於5,故可省去。抒情詩統計律認為:滿足S≤5的詩比較容易背誦。
有人對一些詩人的作品作了統計,其結果如下:作者唐詩宋詞歌德莎士比亞郭沫若艾青樣本數250250150150100100S的值545465。
可見,這些詩人的作品比較易於背誦和記憶。
(二)小說作者的考證
蘇聯著名作家肖洛霍夫的名著《靜靜的頓河》出版後,早在1928年就有人說這本書是抄襲一位哥薩克作家克留柯夫的。1974年,一位匿名的作者在法國巴黎出版了一本書,斷言克留柯夫才是《靜靜的頓河》的真正作者,肖洛霍夫是一個剽竊者,充其量不過是一個合作者罷了。特別是該書的第一、第二卷更是如此。
為了弄清事實真象,一些學者利用計算風格學的方法來考證《靜靜的頓河》的真正作者究竟是誰。他們的具體作法是:把《靜靜的頓河》四卷本同肖洛霍夫與克留科夫兩人其它沒有疑問的作品用計算機提取各種數據,加以分析比較,以便獲得可靠的資料,來澄清存在的各種疑問。統計分析的結果表明,各種數據,《靜靜的頓河》與肖洛霍夫的作品十分接近,與克留科夫的作品則相距甚遠。因而有充分的理由可以斷言,《靜靜的頓河》確係肖洛霍夫的作品。到了1990年5月19日,新華社發自莫斯科的一則電訊說:蘇聯發現了長篇小說《靜靜的頓河》的兩篇原稿,經專家鑒定,這兩篇原稿均出自肖洛霍夫的手筆。與利用計算風格學的方法所得的結論完全一致。至此,這一長達數十年的文壇公案遂告結束。
我國著名的古典小說《紅樓夢》後40回的作者是誰?文學史上一直未能定論,一般認為後40回是高鶚所續寫,但卻缺乏足夠的證據。考證《紅樓夢》後40回的作者是誰,一直是紅學研究中的熱點課題。但過去所用的方法都是從舊有的文獻中去尋找蛛絲馬跡。1976年,在美國威斯康星大學舉行了國際紅學會議,該大學的學者陳炳藻宣讀了一篇論文,他利用計算風格學的方法分析了《紅樓夢》前80回與後40回的用詞特點,認為兩者是一致的。從而作出結論,《紅樓夢》前80回與後40回均為曹雪芹一人所作。石破天驚,陳炳藻的論文為紅學研究方法揭示了別開生麵的一頁。但是,後來有人發現,他所用的統計方法還有缺點,因而其結論尚不足為據。誰是誰非,還有待於曆史的結論。
正由於計算風格學所用的統計方法比較複雜,統計時側重點不同,卻有可能得出大相徑庭的結論。
我們看一個簡單的統計問題:某工廠有5個股東,100個工人,工廠股東的利潤和工人工資總額為:年度工資總額股東利潤2002年10萬5萬,2001年12.5萬7.5萬,2002年15萬10萬。
這裏的項目並不多,數據也不算複雜,但由於統計方法的不同,同樣是這一組數據,卻可以畫出三種不同的統計圖表。
圖a表明:股東總利潤與工人工資總額平行增長;圖b表明:股東利潤增長的比例高於工人工資增長的比例;但相差不大;圖c圖c表明:股東平均獲利遠高於工人的平均工資。
老板會說,股東的利潤與工人工資平行增長,他們沒有得到特殊的利潤。工人則會認為,股東的平均利潤大大高於工人的平均工資,太不公平。你認為誰是誰非呢?
使用計算風格學時也有可能遇到這類情況,所以不能不十分謹慎。