(靈碧曰:順序名次分,將是未來考試的賦分方式,如果我們要實現素質教育的話!順序名次分,既可以保證質量,又可以保障公平。)
關於改進新高考選考科目賦分方案的若幹思考
英文題名:SomeSuggestionsonImprovingtheProportionalGradeScoreofNewGaokao
作者:於涵,韓寧,關丹丹,章建石,焦麗亞
英文作者:YUHan,HANNing,GUANDandan,ZHANGJianshi,JIAOLiya(NationalEducationExaminationsAuthority,Beijing)
期刊名:?中國高教研究
作者單位:教育部考試中心;教育部考試中心評價處
年份:2018
頁碼:P44-49
期號:?第6期
英文關鍵詞:NewGaokao;optionalsubjects;proportionalgradescore;standardsetting
基金:國家社會科學基金2017年教育學重點課題“新高考製度實施與動態調整研究”(AFA)的研究成果
摘要
新高考改革的重要內容之一是將學業水平考試選考科目實行等級賦分,並計入高考總成績。結合新一輪高考改革的相關政策文件和相關研究結果,以及試點省份的實踐反饋等,通過梳理現有選考科目等級賦分的優點和可能存在的缺陷,並對其原因進行探討,從兼顧科學性、公平性和可操作性出發,提出改進選考科目賦分的方案,為進一步深化考試改革提供參考建議。
關於改進新高考選考科目賦分方案的若幹思考
一、研究背景
恢複高考製度以來,?盡管考試科目多次變化組合,但基本規則都是全體考生被分成若幹子群體,每個群體考規定的若幹科目,以總分作為排序和錄取的依據。?從社會視角看,這種錄取辦法具有高度程序公平、極高操作效率、現階段最為公眾普遍認可的特點。
2014?年?9?月頒布的《國務院關於深化考試招生製度改革的實施意見》提出,“改革招生錄取機製,探索基於統一高考和高中學業水平考試、參考綜合素質評價的多元錄取機製。”[1]同年?12?月頒布的《教育部關於普通高中學業水平考試的實施意見》要求,“計入高校招生錄取總成績的學業水平考試?3?個科目成績以等級呈現。?”[2]3?門統考科目和?3?門選考科目(即學業水平考試,下同)分數相加形成總分是新高考(即高考綜合改革試點,下同)的一個重大特征。這種包含選考科目的總分,不同於以往基於相同考試科目的總分,對考試技術提出了嚴峻的挑戰,從國際上也很難找出成熟的先例可以借鑒。
不同選考科目的原始分顯然不能直接相加。新高考實施前各科目原始分之所以可以直接相加,是由於對於同一共同競爭群體(如某省參加高考的全體文科生)而言,其考試科目是完全一樣的,各科目試卷無論
難易,?對這一群體的所有考生來說具有相同影響,原始分數直接相加不影響競爭公平性。?而新高考中,各共同競爭群體中考生的選考科目會有不同,在各科試卷難度也不同的情況下,若將選考科目原始分直接相加,再以總分進行排序,很明顯是不公平的。這同時會給命題帶來極大的壓力和風險。
浙滬設計了一套“等級分”方案,基本思路是“將卷麵分按事先公布的比例確定等級(浙江設?21?級、上海設11?級),再轉換為百分製分數計入總分,相鄰等級的分差均為?3?分”[3]。
從實施效果看,等級分簡單直觀、計算簡便,各等級比例事先公之於眾,容易被公眾接受和認可。?2017年的錄取平穩落地,取得了新高考試點的階段性成功。但試點中也出現了一些新情況和新問題,其中一個比較突出的現象是各選考科目的考生結構發生了不平衡的變化,產生了潛在的問題。
從管理視角看,解決選考結構不合理及學科失衡的現象需要綜合施策,如高校應對選考科目提出更加明確具體的要求,對國家發展戰略需要的學科可適當提高較高等級的比例。?但是,通過對等級分的技術分析,正視等級分可能存在的區分能力低、可能產生價值扭曲情況[4][5],某種程度上甚至加重投機性選考、學科失衡等不符合教育規律和人才培養導向的技術缺陷[4][6][7],提出改進辦法,無疑有助於幫助試點省份和後續省份修改完善方案,讓高考改革在不斷發現問題、解決問題的過程中取得更大的成就。
二、主要問題及原因分析
綜合有關文獻、實踐反饋和我們進行的大量數據模擬來看,以下?3?個問題值得特別關注。
1.可能誘導考生及家長在選科時的博弈心理,造成學科失衡現象。朱邦芬院士指出分數(等級分)高低依賴於一起參考的考生的水準,這種設計非常不利於國民科學精神和科學素質的提高[7]。他的觀點和浙江傳統理科組合(全部在物理、化學、生物、技術?4科中選擇)的選考比例僅為?18.7%的實際數據吻合[4]。陳愛文和胡銀泉指出,等級賦分采用看似公平的相對分,但實際上是“偽相對分”。從考生功利的角度出發,每一位考生都要爭取自己分數的最大化,能否得到高賦分不但要考慮自身水平,更要看跟誰比較,所以在科目選擇上不可避免地產生驅趕效應和磁吸效應[8]。柯政也指出“田忌賽馬”現象是等級賦分製度激勵的結果[9]。王小虎等指出,由於等級賦分重在相對位次,
“目前成績”不好的學生會主動追求相對較為容易的學科參與競爭,這種行為事實上扭曲了不同科目的分數價值[4]。另外,科目的冷熱不均特別是物理學科作為科學素養的重要代表學科,在高中生中遭受冷遇,很可能意味著大批考生的科學素養在相當程度上會呈現減弱之勢,對高校人才選拔和培養工作造成明顯壓力[4]。部分理工科專業對人才的特質性要求高(如化工專業要求學生同時具備物理和化學的優秀素質),而新方案招收的學生可能在知識結構上有所欠缺,不利於國家人才的培養[4]。楊君提出不同科目之間在分數轉換過程中會出現分數倒置現象,即不同的原始成績經等級轉化後,出現有的科目原始分高轉化分低,有的科目原始分低轉化分高,這種倒置現象會引發公眾對考試公平性的質疑[5]。
理論上,如果考生群體充分大且隨機分配,按固定比例劃分等級是合理可行的。?但從實踐來看,在高校對選考科目不同需求的牽引和考生獲得高分的利益牽引的共同作用下,難以避免造成不同科目的考生基數不均衡和能力分布不均衡,這時如果仍按照不區分科目的固定比例來劃分等級和呈現等級分,就會降低不同科目之間賦分的可比性。?如物理本身難度較大,?在高校需求牽引下優秀學生報考比例也較大,這就會造成部分中下水平考生不敢選考,且這種現象可能會形成惡性循環。
2.
賦分過程中可能產生分數差距扭曲,?不利於提高考試的信度。試點兩地在選考科目成績的呈現方式上都是循著?“原始分-百分比例-等級-等級分”的路徑,由於最終呈現的等級分沒有保留考生達到某一等級程度的信息或者說考生原始分數差距的信息,對於落到同一等級內的學生以及落到不同等級的學生都會帶來不同程度的分數差距扭曲:對於相同等級的考生,不管他們的原始分數相差多大全部對應到同一個等級分值;而落到相鄰等級的考生即使他們的原始分差隻有?1?分轉換後等級分也要相差?3?分。
文東茅等模擬研究顯示,等級賦分造成“苦樂不均”,會影響學科特別拔尖者的相對優勢[10]。他們發現,在物理科目中,每個等級之間的原始分差大約為
5~7?分;而在化學學科中,則為?2~3?分。在原始分分布標準差較大的情況下,等級賦分有可能縮小原始分的差距(如物理),原始分分布標準差較小的情況下,等級賦分則會擴大原始分的差距(如化學)。在極端情況下,甚至有可能原始分?2?分之差轉換為等級分後相差
6?分之多。
3.造成選考科目分數的區分度和權重降低,不能合理體現選考科目的價值和重要性。王小虎等指出,等級賦分必然使高考總分的區分度進一步下降。它一方麵減小了分數全距,另一方麵會導致高分學生的大量同分現象[4]。文東茅等通過模擬考試的真實數據,顯示選考科目會有過多的人獲得三科滿分、同分甚至是滿分現象將導致語數外三門課程的重要性進一步提升[10]。朱邦芬院士以物理為例,指出物理學得好而語文、外語成績一般的同學,很難被錄取,因為物理成績對高考總成績的貢獻被邊緣化了[7]。秦春華也表示,由於語數外在總分中的權重較大,中學勢必會選擇將其作為應試訓練的主要科目,物理等基礎性理科教育將受到極大削弱。類似現象曾在前些年個別省的高考改革中出現過,曾迫使部分頂尖大學不得不大幅削減在該省的高考招生指標[11]。
選考科目?3?分一個等級,在考生規模較小的省份
對錄取的影響還不明顯,但對於考生大省來說問題會更加嚴重。?3?分一個等級的設計,初衷是為了減輕學生負擔,避免“分分計較”,但從實際反饋看,為提升選考科目在總成績中的競爭力,在“3?分一台階”設計下,學生和老師反而更加“計較”。陶百強指出現行?3分一個等級的做法使分數區分作用降低與高考的選拔性要求分數差異大以區分考生的客觀需求兩者之間是矛盾的。他認為測驗的計分方式應服務於測驗目的和功能,不宜為了反“分分計較”迂回計分方式[6]。
三、改進方案與建議
已經出現了一些關於如何改進選考科目賦分方案的操作性建議。
楊誌明提出應該采用標準設定與測驗等值相結合的解決方法:各選考科目首次考試成績要進行等級標準設定,?以後每年要精心選擇一個測驗等值樣本,?通過測試和測驗等值推算每個科目每次考試的水平等級線[12]。這是理論上最為完美的解決方案,是最與世界接軌的思路與做法,也是國外很多著名考試項目的常規做法。但我國的考情和歐美一些發達國家大不一樣,他們很多成熟有效的做法在我國未必可行。如每次考試都要組織動機相似的考生樣本組進行保密的額外測試和數據分析等值等工作,不僅在我國由於操作可行性原因難以實施,從理論上看,我國高考和西方以選擇題等客觀性題目為主的考試形式不同,大量內容是難以定量分析的主觀性試題,更有滿分達