正文 第一章 統計工作的步驟和統計學中的幾個基本概念(二)(1 / 1)

三、離散程度指標

1.極差

亦稱全距,即一組觀察值中,最大值與最小值之差。反映個體差異的範圍。極差大,說明變異度大,反之,說明變異度小。

極差計算方便,簡單明了。但極差的大小,僅決定於一組觀察值中之最大值與最小值,不能精確反映其他各觀察值之間的差異,不夠穩定。

2.標準差

方差的單位是原度量單位的平方,使用不便且難於理解,為使觀察值、集中趨勢指標和離散程度指標具有同樣的計量單位,可將方差開方,這就是標準差。即:標準差越大,說明個體差異越大,則平均數的代表性越差。適用於正態分布資料。這就是集中趨勢與離散趨勢的綜合分析。

方差

方差是一個重要的離散程度指標,它的大小隻與觀察值離散程度有關,而與觀察值個數的多少無關。

方差大,說明資料的變異程度大,適用於正態分布資料。

變異係數

亦稱離散係數。即標準差5與均數1之比用百分數表示,即變異係數是相對數,沒有單位,越小,表示觀察值的離散程度越小。它常用於比較:①度量衡單位不同;②均數相差較大的多組資料的變異度。

四、正態分布

1.正態分布的概念

如將頻數湊資料繪製成直方圖。可以設想,如果將觀察單位數逐漸增多,組段不斷細分,圖中直條將逐漸變窄,其頂端將逐漸接近於一條光滑的曲線。這條曲線稱為頻數曲線,近似於數學上的“正態曲線”,略呈鍾型,兩頭低,中間高,左右對稱。這樣的分布稱正態分布。正態分布曲線下麵積分布規律及其應用

①正態分布有兩個參數,即均數和標準差0。

②正態曲線下的麵積分布有一定規律,以正態曲線與橫軸之間的所夾的麵積為1,則橫軸上某一區間和曲線所夾麵積與總麵積之比,相當於變量值在該區間內出現的概率,常用的麵積百分比為:橫軸上,區間與曲線所夾麵積占總麵積的68.279,“±1.960區間與曲線所夾麵積占總麵積的95.00,#±2.580區間與曲線所夾麵積占總麵積的99.00。

③正態分布規律的應用,有些資料服從正態分布或近似正態分布,可利用正態曲線下麵積分布規律:

估計醫學參考值範圍,如果某一指標的觀察值過高過低均為異常,則可用1.965或±2.585求959或9970正常值範圍。如果某一指標的觀察值過高為異常,則可選作為單側957。正常值上限,如果某一指標的觀察值過低為異常,則可選作為單側正常值下限。

2.質量控製,如為了控製實驗中的檢測誤差,常以±25作為上、下警戒值,以1±35作為上、下控製值。這裏的23和35可視為1.965和2.585的均數。

正態分布是很多統計方法的理論基礎,以正態分布理論為基礎,可將[/值作為統計量進行假設檢驗,即V檢驗。以正態分布為基礎,可以推導出其他一些統計量的抽樣分布,正態分布又是其他一些理論分布的極限形式。

五、醫學參考值範圍

醫學參考值範圍是指大多數正常人的解剖、生理、生化等各種數據的波動範圍。對於正常人來說,以上各種數據不一定都相等,故正常值指標不能僅是一個標準值,而是一個波動範圍。根據抽樣調查正常人的結果,可以確定一個大多數正常人的某項指標的參考值範圍,最常用的是參考值範圍。我們的判斷是相對的,更確切地說,正常值範圍是一個參考值範圍。

根據資料頻數分布類型,常用的製訂醫學參考值方法,有正態分布法和百分位數法。如生理指標過低或過高都為異常,分別要確定下限和上限,這稱為雙側;如生理指標僅過低為異常,就隻要確定下限;如生理指標僅過高為異常,就隻要確定上限,這稱為單側。

1.正態分布法

如生理指標為正態分布的資料,可應用正態分布理論,製訂95參考值範圍。

百分位數法

百分位數以符號6表示,用於描述一組觀察值序列在某百分位置上的水平。中位數實際上是百分位數的一個特例。多個百分位數結合應用,可更全麵地描述資料的分布特征,可用於任何分布類型的資料,特別是非正態分布資料。

四分位數間距可看成特定的百分位數,即上四分位數戶75與下四分位數戶25之差,可看成中間一半觀察值的極差。

百分位數不受資料中個別極端值的影響。因而具有較好的穩定性,但當樣本含量不夠大時,靠近兩端的百分位數就不夠穩定。