大數據分析在經濟上是成功的,《大數據時代》一書中舉出了大量的實例,用於說明大數據分析的作用和意義,其中最為典型的是一個購買低價機票的例子和一個股市波動分析的例子。通過大數據分析,人們能夠預測到在什麼時刻購買機票可以得到最優惠的價格,能夠預測到在什麼時刻進出股市可以得到最高的回報。在做這些分析時,人們並不關心影響機票價格的因素是什麼,隻要能夠買到低價機票就達到了目的;人們也不去關心影響股市波動的原因是什麼,而隻要能夠得到高額回報就行了。或者說,在經濟學方麵,大數據分析隻需要提供變量之間是否存在高度相關性,並據此來進行預測,而不需要知道它們之間誰是因、誰是果。
但是,教育是絕對不行的,它的研究不能夠僅僅停留在這個預測的水平上。對教育教學的研究必須能夠找到那些影響教育教學效果的因素或變量,精確地知道它們,並能夠掌握、控製它們,從而優化教育教學。從這一點上說,教育教學是與大數據分析無涉的,或者說大數據幫不上忙。
3 相關性分析與因果性分析
科學在於量化,並且科學結論是可以重複的,這乃是科學研究的特點。對於自然科學的研究,人們在北京大學實驗室裏做出的實驗結果,在上海複旦大學的實驗室裏同樣可以重複實現,保障這一點的就是研究者對研究對象變量的控製。教育學的實驗研究正是仿照自然科學實驗室中的研究方法與過程,來研究教育教學這個社會問題,人們稱其為社會科學。它同樣需要尋找變量,通過測量和量化來采集變量數據,同樣需要對變量進行有效的控製。
變量控製在教育教學實驗研究中是極為重要的一個環節,沒有它人們將無法找到影響因變量的那些自變量,無法完成所期待的問題解決,無法得到確鑿無疑的實驗結論。在實驗研究中,人們將係統中各種影響因素和所關注的現象進行編碼,分別賦予它們自變量與因變量的意義與名稱,然後通過采集數據,再通過對這些數據的分析得出它們的對應關係,從而找到影響因變量的那些自變量,即做出歸因判斷。這個過程中,人們使用的方法為歸納法,即從特殊到一般的研究方法。用這樣的方法研究問題,使用統計學做多元回歸分析,做變量的相關性分析等,常常可以得到各個變量之間的相關程度,會找出那些與因變量高度相關的變量,卻不能就由此斷定變量之間是因果關係。或者說,使用歸納法得出的分析結果,不能夠足以證明其中的一些變量必然是影響另一些變量的原因。
要想確定因果關係,還需要做歸因分析才行。而大數據分析得出的變量關係“不是因果關係,而是相關關係”。使用歸納法得出的變量之間的關係可能是高度相關的,但是沒有充足的理由認定這些變量一定是因果關係。要想證明它們之間存在因果性,通常有兩種方法可以幫助實現這一目標:1)使用演繹法對變量之間的關係進行驗證;2)控製變量數,使得參與其中的變量數最少,僅為兩個。
方法1實際上是遵循了“實踐是檢驗真理的標準”這一原則,因為用歸納法得出的結論是不完備的,需要用演繹法去驗證後才具有完備性。對此,英國哲學家羅素認為:“歸納法不像演繹法那樣確切可信,它隻提供了或然性而沒有確切性;但是另一方麵它卻給了我們以演繹法所不能給我們的新知識。”[2]也就是說,歸納法可以發現新問題,而演繹法可以證明發現問題的正確性。