效度是指測量的真實性、正確性,即該測驗與所要測量的目標特征相符合的程度。效度是一個科學的測量工具所必備的重要條件,無論是選用還是自編的測驗,評鑒的標準首先就是測驗的效度。
效度是一個相對的概念,一種測量工具隻對一定的測量目的有效。因此,判斷測驗效度的高低,主要是看它能達到目的的程度,任何一個測量工具,如果測量的結果沒有達到測驗的目的,即使其他方麵再好,這個測量工具也無效度可言。例如某智力測驗所測得的結果是“越用功、分數越高”,那麼這個測驗實際上所測量的是學生努力的程度,而非智力水平,這個測量的效度一定很低。當然,不能籠統地說測驗有效或無效,而要看它所測量的特性的得分是否準確。
效度的指標常用相關係數表示,稱為效度係數。通常是用該測驗所得的結果(分數)與一個或多個反映測驗目標的標準量數(效標)之間的相關來衡量。相關係數的值越大,表示相關的程度越高,效度也就越高。相反,效度也就越低。
(二)信度
信度又叫可靠性,是指測量結果的前後一致性程度。一個好的測量工具必須是穩定可靠的。如在大體相同的條件下,對一個人或同一組被試進行多次測量,測量的分數若能保持基本一致,該測驗就是穩定可靠的,即信度較高。相反,對同一個人多次測量的得分變化不定,有升有降,就說明其測量的信度較低。
信度的指標用相關係數來表示,又稱信度係數。通常是利用同一組被試兩次測驗後所得到的數據來計算。若兩次測驗分數相關係數越大,表示測量的一致性程度越高,則信度也較高。在不同的情況下,使用不同的方法,可得到不同的信度係數。在心理測量中,常用重測法、複份法、辟半法、同質法等方法來檢驗其信度,采用這些方法所得到的每一種信度都在不同的方麵說明了測驗的穩定性和可靠性。
(三)區分度
區分度是指測驗題目對所測量的屬性的鑒別能力,也就是測題的效度。區分度是反映題目對受測者的心理特征的區分能力的重要指標,也是篩選題目的依據。當測驗被用來鑒別受測者的某種心理特征時,區分度就是測驗的效度指標。區分度高的題目,對受測者的水平有較好的鑒別能力。在這些題目上得高分的受測者實際水平比較高,而得低分的受測者實際水平也就比較低;區分度低的題目,對於受測者的水平就不能很好的鑒別,無論是水平高的受測者還是水平低的受測者所得分數差不多。
區分度的計算方法多采用相關法,即從受測者對題目的反應得分與效度標準或測驗總分之間的相關係數作為該題目的區分度值,相關係數值越高,區分度越好。
區分度與測驗中的各個項目的難易程度也有著十分密切的關係。一般來講,當題目的難度值P在0.5左右時,區分度最高。太難與太易的題目的區分度都不高。鑒別題目難度的高低,主要是看題目的通過率,通過率高說明題目過易,通過率低說明題目過難。因此,題目的難度應適當。
區分度與難度也是衡量一個測驗優劣的重要條件,它將直接影響到測量的效度與信度。
(四)常模
所謂常模是指測量所適用的對象總體的平均水平和分數分布狀態,是解釋和評價測量結果的參照指標。
常模是根據測量所適用的對象總體的平均成績來製定的,它的可信程度取決於樣本(即測量對象)的代表性和可靠性。要使樣本具有代表性和可靠性,首先必須遵守按測量量表將要適用的年齡和地區範圍來隨機取樣的原則,以保證樣本的代表性。其次,取樣樣本的數量應比較大,範圍比較廣,這樣所獲得的常模才可靠。
常模有一定的適用範圍,若是在全國取樣,所得常模是全國的;若在地區取樣,所得常模是地區的,就不能在其他地區隨意使用;有的樣本來自農村,有的則來自城市,有的僅僅隻適用於某一民族,所以在選擇心理測量量表時,要注意測量量表的常模樣本的適用範圍。由於樣本的平均水平會隨著曆史時期的不同而發生變化,常模也將隨之變化。因此,常模要及時修訂。
(五)測量的標準化
在選出一套比較好的題目後,需要對測量量表進行標準化。所謂標準化,就是控製與測量目的無關因素對測量分數的影響,從而使所有的受測者在完全相同的條件下獲取分數。標準化過程包括測量的方法、內容、指導語、答案、評分標準、時限以及分數解釋等環節都應該統一、一致,以保證測量的準確性。
三、心理測量的種類
心理測量的種類很多,隨采用的標準不同而有所不同。按測驗的功能可分為智力測驗、學績測驗、人格測驗和性向測驗;按測驗的對象可分為個別測驗和團體測驗;按測驗的材料可分為文字性測驗和操作性測驗;按測驗的目的可分成預示性測驗、診斷性測驗以及描述性測驗。