第9章 人力資本收益與收入差距:“馬太效應”及其政策含義(1 / 3)

人力資本收益與收入差距:“馬太效應”及其政策含義——對中國個人教育回報率的估計及其分析

人口與勞動經濟研究所 張車偉

一、有關中國個人教育回報率研究的新進展

教育是被研究得最多的人力資本變量,教育與收入關係始終是引起經濟學家興趣的重要問題,有關教育市場回報的研究文獻可謂汗牛充棟。一般來說,教育回報可以有三種不同的定義:個體回報、社會回報以及勞動生產率回報(Blundell,2001)。本文主要研究教育的個人收益,這裏的綜述因此主要關注有關中國教育個人回報率方麵的研究進展。

一般來說,正確估計教育回報率常常受到三類問題的困擾。第一類就是省略變量的問題,在無法控製與教育相關的其他人力資本變量如能力變量等的情況下,有關教育收益率的OLS估計就是有偏的。近年來許多試圖在估計方法上進行改進的主要就是希望克服此類問題的影響。第二類是測量誤差問題,教育變量通常根據教育程度並結合學製估算而來,這不可避免地會帶來測量誤差問題。隨機性的測量誤差會影響到估計效率而不會影響估計的一致性,但係統性的測量誤差會嚴重影響估計的一致性並導致有偏估計。第三類是教育回報的異質性問題,簡單地說,就是收入方程中教育回報率是否被允許隨個體而發生變化。允許可觀測變量的異質性是同質模型(教育回報不隨個體而改變)的直接擴展,這一擴展完全改變了截距項及許多普通的估計方法的特性(Blundell,2001)。李雪鬆和詹姆斯·赫克曼(2004)在考慮了教育回報異質性的研究中發現,與受教育水平相關的收益確實存在顯著的異質性,傳統的OLS和工具變量法都會導致有偏的估計。

有關中國個人教育回報率方麵的研究一直是勞動經濟領域的熱點問題。很多人已經對2002年之前的研究進行了比較詳細的綜述,例如,孫誌軍(2004),Zhang和Zhao(2002)和Brauw和Rozelle(2004)等。所以,這裏主要對最近幾年有關中國個人教育回報率研究的成果作簡要回顧。

綜合已有的研究尤其最近的研究可以看出,雖然有關中國教育收益率的估計多數仍然采用OLS方法,但隨著近年來數據和計量分析技術的改進,其他一些估計方法如工具變量法(IV)、Heckman選擇模型、GMM方法、使用雙胞胎數據的固定效果(Fixed Effect)模型等一些較新的估計技術都得到了應用。從具體結果來看,目前比較一致的結論可以被歸納為這樣幾點。一是中國個人教育回報率總體來看還比較低,使用OLS方法估計得到的教育回報率基本上維持在5%~8%之間,這與國際上其他國家相比處於較低的水平。目前世界平均教育回報率為10.1%,亞洲為9.6%,中低收入國家的教育回報率在11.2%和11.7%之間(Psacharopoulos,1994;Trostel,et al。,2002)。二是有關教育回報率的估計結果因方法不同存在著比較大的差異,例如Li和Luo(2004)使用GMM方法得到城鎮教育回報率總體高達15%。三是中國教育回報率在改革開放以來呈不斷升高的趨勢。Zhao和Zhou(2001)的研究結果表明,中國1978年的教育收益率為2.8%,至20世紀80年代和90年代,也才分別達到4%和5%左右。四是中國個人教育回報率在性別、文化程度、地區和行業間存在著差異,但對此似乎並沒有形成一致的結論。大多數的研究表明,女性的教育回報率高於男性,城鎮教育回報率高於農村,同時大學階段的教育回報率高於高中之前的回報率。

作為人力資本價值的市場信號,教育回報率必然隨勞動力市場變化而變化。因此,對教育回報率變化的最新了解對於更好地理解勞動力市場的變化具有重要的現實意義。鑒於已有的研究大多使用2000年之前的數據,目前個人教育回報率有多高仍然並不清楚。正因為如此,本文將使用最新得到的數據對教育回報率進行估計。與以往的研究相比,本文對教育回報率的研究主要有這樣兩個特點。一是使用了能夠代表城鄉的數據,彌補了以往研究中因數據限製而隻能把城鄉教育回報率分開估計的不足。二是本研究不僅具體地估計教育回報率及其隨教育水平的變化,而且還研究教育回報率隨收入水平的變化狀況與特征。在已有的文獻中,有關個人教育回報率如何隨收入水平變化的研究在中國還很少見到。

二、數據來源及其說明

本文使用的數據來自於中國社會科學院人口與勞動經濟研究所與台灣地區“中央研究院”合作在上海、浙江和福建三省市進行的《家庭動態與財富代際流動抽樣調查》。調查時間為2005年7月,調查對象為年齡在25~68歲的個人。

鑒於城市和農村之間的差異巨大,而城市和農村內部則存在著較強的同質性,本次調查因此選取采用分層多階段PPS抽樣方法,即按城市化水平進行分層抽樣後再分階段抽取調查樣本。具體來看,我們在調查中選擇三省市各自的平均城市化水平為界限,把高於這個水平的地方視為城市地區,而把低於其水平的地方視為農村地區。據此計算,福建省和浙江省的城市層人口占總人口的比例分別隻有27.32%和26.07%,而農村層占總人口比例則分別高達72.68%和73.93%;在這種情況下,按照每層的人口規模比例來決定每層所需要抽取的樣本數量必然造成農村層的過度代表和城市層的代表性不足,並最終使得抽樣缺乏效率。考慮到城鄉之間的差異性,我們最終決定在浙江省和福建省把樣本量在城鄉之間平均分配,這樣,農村層的樣本量縮小為總樣本量的一半。而在上海市隻分兩層抽取,即城市層和農村層,其中城市化高於64.32%的地方為城市層,低於64.32%的地方歸為農村層。

分層確定之後,本次抽樣調查設計分五個階段抽取調查樣本。第一階段按照PPS的方法抽取市區、縣級單位。第二階段在中選的縣級單位內,遵照PPS方法抽取街道或鄉鎮。第三階段在中選的街道或鄉鎮內,遵照和抽取上一級單位同樣的方法(PPS)抽取社區或村委會。第四階段為在中選的社區或村委會,按係統抽樣或隨機抽樣方法抽取家庭戶。第五階段為抽取調查對象。當家庭被選中後,列出家庭中所有年齡在25~68歲成員的名單,然後使用二維隨機表來確定具體調查對象,以確保家庭成員中的每一個符合條件的成員都有相等的概率被抽中。

本次抽樣調查設計意味著每一個省或市的樣本對本省或市具有代表性。因此,在使用調查數據時,如果把三省市的樣本合在一起可以總體上代表三省市總體情況,分開使用時每一省或市對自己都具有代表性,可以分別用來推斷本省或市的總體。

本次調查計劃在上海市抽取1000人,浙江省和福建省都計劃抽取2000人,共計劃抽取5000人。由於被抽中對象因各種原因如不在家或者拒絕訪問等並不一定能夠保證都被成功訪問,所以,最後調查得到的實際樣本數量為4679個。

三、教育回報率及其隨教育水平的變化

在使用明瑟工資方程估計人力資本收益時,方程右邊的變量主要包括兩類,一類為人力資本變量;另一類是和人力資本變量有關同時也和收入有關的變量,這類變量一般也被稱為控製變量。在有關教育回報率的估計中,人力資本變量當然就是教育,而其他必須控製的變量包括能力、工作經驗、性別和年齡等。能力變量由於無法被觀測到而常常被忽略,這樣在估計教育的收益率時就不可避免地遭受“省略變量”偏誤的影響。同時,在一般的研究中,經驗變量常常通過年齡減去上學年限的方法而得到,在這種情況下,年齡變量就沒有必要作為控製變量進入方程。而如果工作經驗變量是直接測量得到的實際工作經驗,在這種情況下,年齡就應該作為控製變量進入方程之中。

如果使用明瑟方程所研究的是一個不完善、分割嚴重的勞動力市場,則在估計方程中隻包括與個人人力資本特征有關的變量是不夠的,在這種情況下考慮市場分割對教育回報率的影響就顯得十分必要。市場分割意味著人力資本回報率在被分割的市場中存在著差異,不考慮市場分割因素影響就不能得到有關人力資本回報率的一致性估計。

雖然OLS估計不可避免地會導致省略變量偏誤,但本文對教育回報率的估計仍然選擇使用OLS技術。這樣做一方麵是因為已有的研究大多都使用OLS估計,結果的可比性比較強,同時也因為本文的重點並非研究教育的“淨”回報率是多少,而是更多地關注教育回報率的變化,OLS估計基本上能夠滿足研究的要求。事實上,由於在一些情況下會出現誤差相互抵消的現象,OLS估計也有可能得到一致性的估計結果(Card,1999)。

在式(1)中,lnY為月平均工資性收入的對數,Edu為平均受教育年限,Exper為工作經驗,Exper2為工作經驗平方項,X為其他控製變量,如年齡、性別、地區、職業和行業變量等,μ為誤差項。

具體來說,作為因變量的收入變量為月平均工資性收入(包括獎金),工作經驗為直接得到的從事當前工作的時間。其他有關個人的控製變量包括年齡和性別,作者這裏所以考慮放入年齡變量,主要原因就在於方程中所使用的經驗變量為調查中直接得到的從事當前工作的時間,而不是使用其他同類研究中慣常采用的年齡減去上學時間的方法得到的經驗,這樣,加入年齡變量就可以控製個人因出生年代不同所導致的教育程度差異對收入的影響。