相關性最初是統計學意義上的一個概念。考慮兩個隨機變量的聯合密度函數,相關性描述的就是這兩個隨機變量之間的關聯程度,也就是說,根據一個隨機變量的信息來獲得另外一個隨機變量信息的能力。金融理論上的相關性指的是兩個收益率序列的協同運動程度。一個很強的正相關性表示,當一個收益率序列向上運動時,另外一個收益率序列也將向上運動;一個很強的負相關性表示,當一個收益率序列向上運動時,另外一個收益率序列將向下運動。
兩個隨機變量之間一個比較簡單的協同度量指標是協方差,也就是聯合密度函數均值的一階乘積矩。
相關係數絕對值越高,表明兩個序列之間關係越強,“相互依賴”程度越強。如果兩個隨機變量在統計上是獨立的,那麼,它們之間的相關係數估計值應該是不顯著異於零的。一般稱零相關係數的變量之間是正交的。但是,正交並不意味著獨立。因為獨立表示兩個隨機變量之間不存在任何關係,而正交則表示兩個隨機變量之間不存在線性關係。
金融市場上經常存在著非線性依賴現象,因此,相關係數並不是一個非常合適的度量非線性相互依賴的指標。相關係數在度量依賴性方麵的作用是很有限的。這是因為在金融市場上相關係數估計缺乏穩健性,被用來估計的隨機變量序列可能不是平穩的。在不平穩的情況下,估計可能會產生謬回歸問題。一般認為,收益率序列可以用相關係數來檢查其短期相關性;而長期相關性的考察,一般使用長程記憶模型,譬如對價格序列作協整分析。
隨著時間變化,相關係數未必是不變的。導致相關係數變化的原因有:(1)資產收益率之間的相互依賴在本質上可能是高度非線性的,而相關係數僅僅是一個線性度量指標;(2)相關係數本質上是一個靜態指標,而市場之間的動態關係可能存在某種領先滯後屬性;(3)由於時間序列本身的原因,相關係數估計值可能存在跳躍現象。隻有當兩個平穩收益過程是聯合協方差平穩過程的時候,相關係數才是不隨時間變化的。我們稱此時的相關係數為無條件相關係數。
如果確實存在著某個無條件相關係數,在整個過程中,該相關係數的值是唯一的。那麼,由於樣本數量越少,樣本誤差就會越大。這樣,隨著取樣時間不同,樣本規模不一樣,估計得到的相關係數就會不一樣。這種樣本相關係數的變化反映的就是樣本誤差問題。但是,另一方麵,我們根據上述統計公式總可以計算得到某些相關係數。這反過來又證明在序列之間存在或不存在某種聯合協方差平穩關係。此時,這種穩定性很明顯就是一種人為之物。這就提醒我們,在用統計模型分析時,要結合經濟意義或者經濟理論來進行。
另一種處理方法就是對模型進行放寬,可以考慮隨時間變化的相關係數模型。這種模型稱為條件相關係數模型,它一般假定收益率聯合分布的特征參數是隨時間變化的。這類模型的代表是雙變量GARCH模型。但這類模型的估計值是非常不穩定的。相關係數也經常表現出很大的跳躍。
n-日曆史相關係數可以通過滯後n天的等權重協方差估計除以n天方差估計值乘積的平方根得到,樣本規模越大,估計精度越高,這是因為樣本誤差和樣本數量平方根成反比。例如,根據同樣的每日樣本數據,30天的相關係數估計比60天的相關係數估計更有可能發生變化。無論估計長度為何,或者估計值為何,這裏,要估計的曆史相關係數總是一個常數。它的不同值變化隻能夠歸因於樣本誤差。根據上麵推理,看起來好像計算時間跨度越長,樣本誤差越小,從而曆史相關係數越精確。但實際上,由於存在極端事件,當時間跨度越長時,極端事件影響的範圍越廣。極端事件會影響相關係數,就會導致樣本相關係數精確度降低。