Logit模型采用的是邏輯概率分布函數,它的具體形式為:
pi=F(Zi)=F(a+bXi)=11+e-Zi=11+e-(a+bXi)(72)
式中,e代表自然對數的底,約等於2.718。對於給定Xi,pi是個體做出某一特別選擇的概率。對上式進行逐步變換可以得到下式:
Logpi1-pi=a+bXi(73)
模型中因變量是做某一特別選擇的機會比(odds)的對數。
odds=p(y=1)1-p(y=1)=p1-p(74)
p(y=1)=p為“發生”的概率,p(y=0)=1-p為“不發生”的概率。機會比反映的是兩種情況或兩種狀態的“優劣之比”、“多寡之比”,所以又稱“優比”,其優點是直觀易懂,缺點是不同的機會比之間難以直接比較大小,因為機會比不是百分比,分母是不相同的,必須通分以後才能比較。
對機會比取對數,記為
Logit(p)=Log odds=Logp1-p(75)
這個轉換稱為Logit轉換。
所謂Logistic回歸,就是把機會比的對數Logit(p)看成是自變量X的線性函數,其表達式如式73。
Logit模型的一個重要優點是它把在(0,1)上預測概率的問題轉化為在實數軸上預測一個事件發生的機會比的問題。邏輯分布函數的斜率在p=1/2時最大,這說明自變量對某一選擇概率的影響在分布的中點最大,而分布兩端的斜率比較小,說明較大的X的變化才能引起較小的概率變化。對於原始數據的Logit模型估計,由於離散變量的誤差服從貝奴裏分布,而非正態分布;其次0~1變量的方差非常量,會帶來異方差,違背了經典假設。如果pi碰巧等於0或1,機會比pi1-pi就會等於0或無窮大,則機會比的對數就沒有定義。因此對上麵的模型就不能采用OLS估計,隻能用極大似然估計參數。
(3) 結果與分析
我們利用SPSS12.0軟件,采用向前逐步篩選法(Forward Stepwise)進行回歸計算。第一步(step1)進入方程的自變量是家庭金融資產總量(FA);第二步(step2)戶主受教育程度(EDU)進入方程;第三步(step3)家庭年收入(YI)進入方程;第四步(step4)戶主年齡(AGE)進入方程,形成了最終回歸方程。
aVariable(s) entered on step 1: FA.
bVariable(s) entered on step 2: ED.
cVariable(s) entered on step 3: YI.
dVariable(s) entered on step 4: AGE.
根據回歸分析的結果,可以建立如下模型:
Logp1-p=-2.880-0.367AGE+0.317EDU+0.102YI+0.035FA(76)
其中p代表居民持有股票的概率,1-p表示居民不持有股票的概率。式76是Logistic方程的幾率對數的形式,從該式可以看出,Logistic方程的回歸係數可以解釋為一個單位的自變量的變化所引起的幾率對數的改變值。上式還可以改寫成:
p1-p=e-2.880-0.367AGE+0.317EDU+0.102YI+0.035FA(77)
這樣,當某個自變量發生一個單位的變化時,幾率的變化值就是Exp(該變量的回歸係數)。如果係數為正值,就意味著幾率將會增加;反之,幾率將會減少。
根據模型估計結果,本文將影響居民是否持有股票的因素歸納如下:
第一,戶主的年齡(AGE)。當自變量“被調查戶主的年齡”的值發生一個單位的變化時,如被調查居民的年齡從30~40歲變更到40~50歲之間的,變量值增加一個單位,對持有股票的意願的幾率就下降了Exp(-0.367),即0.693。這主要是因為,我國股票市場發展時間短,居民認識不足,居民年齡的增長也伴隨著家庭負擔的加重,沒有精力來選擇股票進行投資,退休的居民因為收入減少,也多數選擇儲蓄和基金等方式,這和我們前麵的分析相一致。正如一般的金融理財師對投資者的建議,年輕人投資更多的資產在風險資產如股票,而隨著年齡的增加,對風險資產的投資應該減少。因此,隨著年齡的增長,居民參與股票投資的意願在不斷降低。