基於內容效度的大學英語學業測試實證研究
高教研究
作者:王宛宜 孫傳捷
應用重測法,從獨立學院特點的角度,對近兩年大學英語學業測試內容效度進行實證研究。通過問卷、訪談、試卷分析等有效數據的分析,論證了不同因素對測試內容效度的影響及其相互關係,從而為製定符合獨立學院特點保證測試效度的試卷,提供了可靠依據。
學業測試 內容效度 真實水平可靠信息
一、研究背景
語言測試效度研究被引入大學英語教學後,隨著教學理念、教學模式的更新而快速發展。由於曆史原因獨立學院發展起步較晚,在教學模式、測試評估體係等方麵受傳統習慣影響,大學英語學業測試雖然采用了終結性評價和形成性評價相結合的方法,但仍以終結性評價為主,在測試模式上固定單一;因學生英語基礎較差,兩級分化嚴重,試卷客觀題量偏大。由於客觀題出題較難,有的教師在擬定客觀題時直接引用現成的題目;有的甚至模仿、照搬大學英語四、六級考試,忽視了獨立學院與其他學院的區別和學生特點,致使學業測試無法準確的檢測大學英語教與學的實際情況。因此,進行學業測試內容效度研究,檢測學業測試是否考了教學目標所規定的內容;是否達到了測試目的要求;試題題型的設計是否合理等等這些問題都關係到測試的效度。
二、文獻綜述
內容效度是指測試內容與預定要測試內容之間一致性的程度,包括相關性和內容覆蓋麵,是評價一個測試的出發點。測試的相關性即測試內容和測試的目是否一致。內容的覆蓋麵是指試題所代表的需要測試的範圍是否充分。內容效度是檢驗測試質量的一個重要指標,是測試效度的一部分。
近半個多世紀,語言測試效度的研究取得了重大進展。自20 世紀60年代以來,效度理論發展大體劃分為3個時期:(1)單一效度觀時期;(2)分類效度觀時期;(3)效度整體觀時期,但在不同時期內容效度始終被認為是效度的一部分。90年代後效度理論發生了明顯的變化。“國際心理測量學界在1999年修訂的新版《教育與心理測量標準》(Standards for Educational and Psychological Testing中,效度被定義為“關於測驗分數的特定解釋所得到的支持程度。這種支持來自累積的證據或理論。這種解釋是測驗應用的基礎。”(184頁)這裏,通過考察測驗內容與測驗構念之間關係的(在編製測驗時,對“這個測驗測什麼?”問題的回答,就是“構念”)基於內容的證據仍是效度證據的重要來源。”(謝小慶2010)在收集效度證據的6種方法中的內容分析、項目(題目)或任務的實驗分析、緯度分析方法均屬內容效度範疇。內容效度一直被認為是檢驗測試的一個重要指標。內容效度的作用是考察學生對所學知識的掌握,一般要參考某種教學大綱,甚至考慮到教學法,對語法要素和技能都要有所體現。測試是否符合教學內容,試題是否適合被測試的學生,所教過的東西都應在檢測範圍內,並應注意具有代表性的試題應占有一定比例。因為高內容效度是良好學業測試與評價最重要的特征之一。如果測驗內容效度不理想,那麼它就無法準確反映學生在學習方麵的信息。依據學生分數所做的解釋、推論和決策也不會合理和有效。這樣的測驗,即使精心施測與客觀評分,而且實際獲得的信度、難度和區分度指標都可以接受,也不能被認為是好的測試。
三、研究設計
研究的主要問題:學業測試是否檢測出了學生英語學習的實際水平。研究目的:進一步了解獨立學院學生學習特點和影響測試內容效度的相關因素,提高測試效度,使其對教學發揮積極的反撥作用。研究對象為09、10、11級學生,對2010至2012學年度四個學期的大學英語期末測試內容效度的跟蹤調查。研究方法:采取文獻研究、訪談、問卷調查、試卷分析相結合的方法進行實證研究。被訪談、問卷者為學習相對穩定的班級、學生,以保證收集的數據真實可靠。被抽取的有效訪談、問卷為2010-2011學年度第一學期32份,2011-2012學年度第二學期51份。
四、數據分析
分析表明:1、大多數學生認為,目前的大學英語學業測試基本上反映了他們的實際水平。但在題材、體裁的選擇,題目(內容)表述等方麵需改進。2、2011-2012學年度第二學期比2010-2011學年度第一學期在測試內容與測試目的要求一致性提高了9%;覆蓋麵提高了9%;難題比例降低了8%:中等難度提高了6%;容易題比例提高了 3%;區分度有所提高,測試效度明顯提高。