第45章 追求公平的空軍(上架感言中提到)(1 / 3)

關於浙江新高考賦分方案的再思考

——並修訂“順序名次分”

劉典正

摘要:新高考沿用總分錄取的辦法,總分=必考3科原始分+自選3科等級分。原始分本不可加,因社會認可並操作簡單而“好用”;等級分雖易引發博弈而難保障學科均衡,但因保障機製而“能用”。原始分經排名次用等差數列轉化,可變為理論可加而有望好用的“順序名次分”。名次分是中國式等值機製,具有理論公平性;其科學性,因考試區分度而顯現;易操作性,因名次的自致性可以依靠電腦;而其可行性出於國情,約定則成。

關鍵詞:新高考,原始分,等級分,名次分,新框架

引言

啟於2014年的浙江新高考,統一招生沿用總分錄取的辦法:必考3科語數外計原始分,自選3科賦等級分,總分=3科原始分+3科等級分。基於改革實踐,再結合中國高考計分曆程:原始分——標準分——原始分,我們對新高考賦分方案的判斷是:原始分不可加但好用,等級分不好用但能用,賦分方案不具備剛性。新高考改革諸目標之實現需要更加科學而適合中國國情的賦分方案,可加、好用、剛性是基本要求。

一、原始分不可加但好用

原始分即卷麵分數,是根據考生答卷情況直接給出的分數,沒有經過轉換處理,可以反映出考生答題的實際水平。但原始分的缺點非常明顯,章建石認為“一是分數的意義不明確,不能表明位次方麵的信息;二是穩定性欠缺,沒有可比性;三是不具備可加性”[1]。溫忠麟有類似的表述:“統考科目使用原始分”,“存在兩個方麵的不足:一是不同科目的原始分沒有可比性,無法直接相加;二是直接相加的結果與政策設定的權重可能出入很大”[2]。綜上可以歸並為原始分不具備定位性、可比性、可加性、穩定性。

1、原始分不具備定位性

原始分不能反映某考生在全體考生中的位次。期中考試小明語文108分(滿分150分),我們以班為單位(全體),隻有考慮到全班同學的最高分、最低分、平均分,等等,經過一係列繁雜的統計才可以明確地說明他的成績怎麼樣,他在全班同學中處於什麼位置。反之,我們隻知道小明的原始分是不能判斷他的成績之高下的,因為位次不明確。

2、原始分不具備可比性

位次不明確可以推論出:不同科目或者同一科目的不同次考試之間,原始分不具備可比性,比較是無實質意義的。如,期中考試小明語文108分,英語同樣108分,若滿分都是150分,是不是語文英語實質成績相同?我們不知道。因為原始分受試題難度的影響,試題若難原始分就低,試題若易原始分就高。如果期中考試全班語文均110分、英語均105分,那麼,小明的語文比班平均分低2分,而英語比班平均分高出3分,同樣的108分卻代表不同的水平。所以,就原始分所代表的實質成績而言,語文108分≠英語108分,即不同科目(或同一科目不同次考試)的原始分1分≠1分,所以原始分的“每1分”並不一定等值。實際是因為原始分不具備定性位導致原始分數不具備等值意義上的可比性,所以使用原始分不能對考生水平進行有效的比較。

3、原始分不具備可加性

原始分不能直接相加,因為原始分的“每1分”並不等值,即原始分1分≠1分。高考中,我們習慣於依據考生各科原始分相加得到的總分進行錄取,然而,這是不科學的。原始分不可直接相加,強加一起如“語文108分+數學108分+英語108分=324分”,就分值而言“語文1分≠數學1分≠英語1分”,所以324分是難以準確反映三者分值之和的。也就是說,原始分的簡單直接相加所得之和是不能反映各科實質分數之和的,因此原始分不具備可加性。

4、原始分不具備穩定性

原始分不穩定,易使權重變形。比如高考中語數外各150分,即政策權重之比為,語文150分:數學150分:英語150分=1:1:1,由於難度等因素,若實際平均分之比為,語文125分:數學108分:英語115分≠1:1:1,即從平均分的角度考量,各科實際權重125:108:115不等於政策權重1:1:1。明顯,權重發生了變化。

原始分有如上弊端,要進行各科考試實質分數的相加,就要對原始分進行轉化導出,對各科分數進行定位,校正其權重,使各科分數可比可加,如此才能使各科成績和之總成績有效。導出分數是在原始分數的基礎上,根據確定的規則轉化出來的,其目的就是解決原始分所難以解決的定位、可比、可加、權重等問題,就是為了更好、更合理地解釋分數的含義,實現分數的等值化,使之意義明確。

原始分需要轉化導出才更加有效,實踐中我們也引進相關的技術,如高考中使用過標準分,但是,民眾不理解,除海南外均退回用原始分。民眾的邏輯是:雖然原始分數“語文1分≠數學1分≠英語1分”,但是差不多,一分就是一分,確確實實就是考生自己考試所得,感覺好像是等值的;經過標準分這個引進的辦法轉化導出之後,民眾不理解、不習慣,不信任,以致原始分不能動。標準分的實踐未取得預期效果,本來考試標準化改革是為了高考更加公平有效,民眾不認可怎麼辦呢?隻能遵從民意。於是,高考統考科目賦分方式坐了一次過山車回到了原點:原始分——標準分——原始分,還需要找到原始分可加的理由:“新高考實施前各科目原始分之所以可以直接相加,是由於對於同一共同競爭群體(如某省參加高考的全體文科生)而言,其考試科目是完全一樣的,各科目試卷無論難易,對這一群體的所有考生來說具有相同影響,原始分數直接相加不影響競爭公平性。”[3]?這便是我們需要明白的“治理困境”。因而,原始分簡單直接相加,在中國很好用。民眾認可就好用,這是一種約定或契約?

無論如何,從表麵來看:確實是民眾所認可的原始分延續運用,皆備公平與效率的標準分逐步退出高考。換一種導出分數來試行,如等級賦分製,它的境遇估計不會比標準分好多少,考試的文化環境對考試的運行之影響是客觀存在的,它們在中國犯了共同的錯誤:動了原始分,或者說,用我們不習慣的方式動了原始分。任何引進的理念製度文化要融入本土文化都需要一個融合的過程,這個反應是一個化學式反應,不是物理式反應,即使理念得到完全認同,技術操作層麵也不一定完全照搬,因此,直接運用等級賦分製就注定不會一帆風順。

二、等級分不好用但能用

浙江的實踐告訴我們:等級賦分製不好用,但現在還能用還要用。

等級賦分製的不好用,是因為不認可、不習慣、不符合中國國情、不能融入中國考試文化,主要體現在以下三點:1、可能誘導考生及家長在選科時的博弈心理?,造成學科失衡現象;2、賦分過程中可能產生分數差距扭曲?,?不利於提高考試的信度;3、造成選考科目分數的區分度和權重降低?,不能合理體現選考科目的價值和重要性[4]。

1、選科博弈屬正常,學科失衡則不正常。浙江7選3,從考生個人水平的角度出發,肯定要從7科裏邊選自己最感興趣、最特長的3科,以保證拿到最高原始分;但選考科目的等級賦分製是一種相對賦分,任何相對賦分不僅要看原始分的絕對值,更要看和競爭對手相比之後的相對位次;那麼,要想提高位次得高分,除自己實力外就需要更多的相對較弱的對手;所以說,相對賦分產生博弈是正常的。物理、化學兩科是比較繁難的學科,但又很重要,問題就出現在難而重要。當大量考生趨易避難,選考繁難學科的都是少量優秀者,當某一學科因難學而退出的相對較弱學生過多,這就造成學科失衡:一則因為該學科人數少,二則因為這些繁難學科的重要性。重要的科目學生少,這是不正常的。保障機製的作用在於:當繁難學科最弱檔次學生放棄時,虛擬一部分考生,使實際考生的位置不會後移。而順序名次分的邏輯是:固定每一個名次,有人退出,後邊名次前移,而不是被向後擠。在名次分的機製中不因博弈而影響有興趣、特長學生的位次,博弈隻能成為無興趣愛好、沒有特長的無絕對實力者的專利,博弈對上中等學生的影響極其有限。

2、相對賦分因排序而改變原始分數的差距是必然的,但等級賦分製可達到扭曲的程度則是民眾難以認可接受的。簡單來說,某科滿分100分,設有一組原始分:95、90、89、88.5、88,排序:第一、二、三、四、五名,排序後給我們的感覺是:相鄰名次之間是等距的,而原始分的實際分距是:一、二名5分,二、三名1分,三、四名與四、五名是0.5分,5分≠1分≠0.5分,並不相等。如果不改變原始分數的差距且每1分一個名次,應該這樣排序:假設100分是第一名,則95分第六名、90分第十一名、89分第十二名、88.5分第十二名半、88分第十三名。“第十二名半”,出現了半名,根本不符合我們排序的習慣和排序概念。所以說,排序會改變原始分數的差距。等級分是這樣產生的:原始分-排序-比例-等級-等級分,就是說,排序之後還要按照人數百分比例劃分等級,問題就出在這裏。扭曲的表現分為:縮小、擴大、極端情況三種。按等級賦分製之規定,同一等級之內等級分相同,而同等之內考生的原始分可能會相差較大,同等內原始分有差距變成了沒差距,這是縮小了原始分的差距;一分之差,分為兩等,相差了三分,這是擴大了差距。有一種極端可能的情況是:同分落入不同的等級,“如果某個學科相同分數的人數比例過高,還會出現同分不同等的極端情況”[5]。這三種情況,都是民眾難以認可接受的。

3、區分度下降是因為把不同的原始分落入了同一等級;權重降低一則因區分度下降,二是因分數全距減小。按照人數百分比例賦分,不僅有可能使不同原始分落入同一等級而縮小了分數差距,更因此而使等級賦分製下的選考科目區分度下降,同分現象之人數比例與等級賦分之人數比例相同,區分度的下降實源於此人數百分比例。由於選考科目易同分,那麼區分度自然倚重於語數外,語數外的權重自然提高,那麼,選考科目的權重則相應下降。選考科目的權重降低,還因為分數全距的縮短。浙江選考科目等級賦分製40分起賦,實際分全距是[40,100],而語數外的滿分各150分,理論上的分全距是[0,150]。為了使選考科目不被邊緣化,提升選考科目的區分度和權重迫在眉睫。

等級賦分製的不好用還體現在學生的認可度上。社會的認可,尤其是考生是否認可,我們需要高度重視。考生對於高考改革的基本看法一定程度上左右著家長等相關人士,並共同影響著社會認可度。劉希偉等認為“學生的知識與眼界畢竟相對有限,高考政策調整不可能完全吸收學生的意見與建議”,“他們對於高考政策的認識可能是偏頗的”,我們“必須加強高考政策的解讀與宣講,引導學生形成較為全麵、理性的認識,以便盡可能為深化與完善高考改革方案創造有利支持條件”[6]。我們認為學生的知識與眼界相對有限是相對的,它們的認識或許有可能是偏頗的,對他們加強高考政策之解讀與宣講也是必要的,引導其形成較為全麵、理性的認識也是需要的,為深化與完善高考改革創造有利支持條件也是可以爭取的,但是,高中生的意見必須要得到應有的尊重,畢竟他們已經達到或將要達到高中畢業水平,而且,高考改革的直接服務對象就是高中生。根據調查數據,學生對等級賦分的認可,表示“比較讚成”的比例71.81%,“非常讚成”的比例為7.22%,選擇“不讚成”的學生占比20.96%。[7]從選項來看,隻有“非常讚成”、“比較讚成”、“不讚成”三項;如變為“非常讚成”、“讚成”、“比較讚成”、“比較不讚成”、“不讚成”、“非常不讚成”六項,考生可以充分自由選擇。或者提供“非常讚成”、“比較讚成”、“比較不讚成”、“非常不讚成”四個選項,考生也可以自由表達意誌。而讚成方麵有兩個選項“非常讚成”、“比較讚成”,不讚成方麵隻有“不讚成”一個選項,在選項設置上這是不對等的,容易影響考生的選擇,引導學生讚成。從數據來看,“不讚成”占比高達20.96%,五分之一強,很不低,一定程度上能夠說明等級賦分製在學生認可方麵的“不好用”。