欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍一、抽樣推斷分析的特點抽樣推斷,是按照隨機原則從總體中抽取部分單位進行調查,並依據所獲得的數據資料對總體的某一數量特征做出具有一定可靠程度的估計與推斷,從而達到對全部總體認識的一種統計方法,又稱抽樣法、抽樣估計。抽樣推斷是認識現象總體的一種重要方法,在統計調查研究活動中廣為應用,如市場商品需求量調查、城市居民家庭收支情況調查、城鄉居民的電視收視率調查以及民意測驗等。抽樣推斷一般有如下特點:(一)抽樣推斷是由部分推算整體的一種認識方法抽樣調查是一種非全麵調查,但調查的目的卻不在於了解部分單位的情況,它隻是作為進一步推斷的手段,目的仍在於要認識總體的數量特征。這裏存在著手段與目的、局部與整體間認識上的矛盾。例如,檢測少量棉花纖維的長度,能不能判斷整批棉花纖維的長度;對少量種籽進行催芽試驗,能不能判斷該品種整批種籽的發芽率等,這種矛盾在現實生活中是大量存在的。抽樣推斷原理解決了這一矛盾,它科學地論證了樣本指標與相應的總體參數之間存在著的內在聯係,兩者誤差的分布也是有規律可循的,並提供了一套利用抽樣調查的部分信息來推斷總體數量特征的方法,這就大大提高了統計分析的認識能力,為信息采集和開發開辟了新的途徑。

·180·學習單元八抽樣推斷分析(二)抽樣推斷的基礎是隨機抽樣抽樣調查可以是隨機(概率)抽樣也可以是非隨機抽樣,但是作為抽樣推斷的基礎則必須是隨機抽樣。按隨機原則抽取樣本單位,是抽樣推斷的前提。它的優點在於:可以保證每個單位有同等中選或不中選的機會,完全排除主觀意識的作用,避免係統誤差;可以事先掌握各種樣本出現的可能性大小,提供樣本指標數值的分布情況,計算樣本指標的抽樣平均誤差,同時估計樣本指標與總體指標的抽樣誤差不超過一定範圍的概率保證程度,即對抽樣誤差進行控製;可使任何一個樣本變量都是隨機變量,因而任何一種樣本指標(或統計量)也是隨機變量,抽樣推斷才可能利用概率論原理來研究樣本指標與總體指標的關係,確定優良估計的標準,為抽樣設計尋求更有效的抽樣組織形式建立科學的理論基礎。

(三)抽樣推斷的誤差可以事先計算並加以控製以樣本指標估計相應的總體指標雖然也存在一定的誤差,但它與其他統計估算不同,抽樣誤差範圍可以事先通過計算加以確定,並且可以采取必要的組織措施來控製這個誤差範圍,保證抽樣推斷的結果達到一定的可靠程度。

(四)抽樣推斷的方法是概率估計利用樣本指標來估計總體參數,在數學上是運用不確定的概率估計法,而不是運用確定的數學分析法。因為,樣本數據和總體參數之間並不存在嚴格對應的自變量和因變量的關係,它不能利用一定的函數關係來推算總體參數。而運用概率估計的方法,則可以達到滿意的效果。

二、抽樣推斷分析的內容(一)抽樣推斷分析的作用抽樣推斷作為一種科學的統計方法,主要具有以下的作用:(1)對某些不可能或不必要進行全麵調查的社會經濟現象總體,可采用抽樣的方法,以樣本資料對總體狀況作出推斷,如產品質量的破壞性檢驗、民意測驗等。

(2)與全麵調查相比,抽樣推斷可節省調查費用和時間,達到提高調查效率與效益的目的。

(3)可以用抽樣資料對全麵調查的資料加以補充或修正,以檢查全麵調查工作的質量。例如人口普查、基本經濟單位普查等,由於調查人員多、涉及麵廣,常易產生操作性的登記性誤差,可采用抽樣調查的資料對其進行補充和修正。

(4)抽樣推斷可用於工業生產過程的質量控製。對於成批或連續大量生產的產品生產過程,通過抽樣方法可以及時提供有關產品質量方麵的信息,分析各種可能的原因,以便采取措施,排除故障,使生產過程保持正常穩定,從而起到對生產過程進行質量控製的作用。

(5)利用抽樣原理,可以對某些總體進行假設檢驗,並判斷這種假設的真偽。

(二)抽樣推斷分析的內容抽樣推斷的目的,並不在於了解樣本的數量特征,而是借助樣本的數量特征,來估計和檢驗總體分布的數量特征及某些未知因素。根據解決這一問題著重點的不同,抽樣推·181·經濟統計分析斷的主要內容包括三個方麵:隨機抽樣、統計估計和假設檢驗。

(1)隨機抽樣,即按照隨機原則從總體中抽取部分單位構成樣本的過程。隨機抽樣的中心是抽樣調查方案的設計,主要包括抽樣技術和試驗設計兩項重要內容,旨在保證被抽選單位的隨機性和樣本的代表性,保證選擇正確的抽樣方法和製定科學的抽樣方案。

(2)統計估計,即根據隨機抽取的部分單位的特征,來對總體的分布函數或數量特征等進行推測估算的過程,它是抽樣推斷的中心內容。如,糧食產量的抽樣調查、產品質量的抽樣調查、民意抽樣測驗等都屬於統計估計的推斷方法。

(3)假設檢驗,也稱顯著性檢驗,即根據經驗或認識,對總體的狀況提出某種假設,依據抽樣推斷的原理,根據樣本觀察資料對所作假設進行檢驗,以判斷這種假設的真偽,決定是否接受該假設。如某企業生產的某種產品,經過工藝流程改革,不知道產品質量是否有所提高。我們不妨假設工藝改革沒有效果,產品質量和以往正常生產的產品質量並無顯著性差異,所有差異僅僅是由於隨機性的原因引起的,樣本指標的實際值和假設的總體參數之間的差異是否超過了給定的顯著性標準。如果已經超過了這一標準,或者說這種差異僅由隨機性因素引起的可能性是很小的,我們就有理由否定原來的假設,而采納其他的假設,即認為工藝改革是有效果的,產品質量有所提高,而且這種質量差異是顯著的,新的工藝流程值得推廣。當然檢驗的結果也有可能是相反的,那麼我們就有理由認為這種差異是由隨機性原因引起的,接受工藝流程改革沒有效果的原假設,新的工藝流程不宜推廣。

檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺殣殣統計小辭典第三產業的含義1.第三產業是憑借一定的物質技術設備,為社會生產和人民生活服務的各種行業的總稱。

2.在我國,第三產業主要分為四個層次:第一層次是流通部門,包括交通運輸業、郵電通信業、商業、飲食業、物資供銷業和倉儲業;第二層次是為生產和生活服務的部門,包括金融業、保險業、房地產業、地質普查業、居民服務業、旅遊業、谘詢業、信息業和各類技術服務業等;第三層次是為提高科學文化水平和居民素質服務的部門,包括教育、文化、廣播電視事業、科學研究事業、衛生、體育和社會福利事業等;第四層次是為社會公共需要服務的部門,包括國家機關、政黨機關、社會團體,以及軍隊和警察等。

第三產業的興旺發達是現代經濟的一個重要特征。

殣(資料來源:國家統計局)檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺殣三、抽樣推斷分析的幾個基本概念在學習抽樣推斷方法的過程中,常會遇到一些名詞、術語,為了掌握抽樣調查推斷的·182·學習單元八抽樣推斷分析方法原理,首先要明確抽樣調查推斷過程中常用的幾個基本概念。

(一)全及總體和樣本總體(1)全及總體,又稱母體(簡稱總體),它是指所要認識的、具有某種共同性質的許多單位的集合體。全及總體的單位數,通常用字母N表示。對於一個總體而言,若被研究的標誌係品質標誌,則將這個總體稱為屬性總體;若被研究的標誌係數量標誌,則將這個總體稱為變量總體。變量總體按所包含的單位數和相應變量值的多少,可分為有限總體和無限總體;按變量的連續性不同,可分為連續總體和離散總體。

(2)樣本總體,又稱子樣(簡稱樣本),它是從全及總體中隨機抽取出來,代表全及總體的那部分單位的集合體。樣本總體的單位數稱為樣本容量,通常用字母n表示。相對N而言,n是很小的數值,它可以是N的幾十分之一、幾百分之一,甚至更小。以很小的樣本來推斷很大的總體,這是抽樣法的重要特點。一般而言,樣本單位數達到或超過30個稱為大樣本,而在30個以下稱為小樣本。社會經濟現象的抽樣調查多為大樣本。

全及總體是我們所要認識的對象主體,而樣本總體則是我們所要觀察的對象主體。

樣本來自總體,但又代表總體,兩者是既有區別又有聯係的不同範疇。對於一次確定的抽樣調查,全及總體是唯一確定的,而樣本則是不確定的和隨機的。一個全及總體可能抽出很多個樣本總體,樣本的個數和樣本的容量有關,也和抽樣的方法有關。

(二)全及指標和抽樣指標(1)全及指標,也稱為總體指標或母體參數(簡稱參數),它是根據全及總體各單位的標誌值或標誌特征計算的,是反映總體某種屬性或特征的綜合指標。由於全及總體是唯一確定的,根據全及總體計算的全及指標也是唯一確定的。

不同性質的總體需要研究不同的全及指標。對變量總體,常用的有總體平均數X和總體標準差σ(或稱總體方差σ2)。對屬性總體,常用的是總體成數p。

(2)抽樣指標,也稱為樣本指標或樣本統計量(簡稱統計量),它是根據樣本總體各單位的標誌值或標誌屬性計算的,是用以反映總體指標(或參數)的綜合指標。由於樣本總體也可看成是一個次級總體,也屬於“總體”的範疇,故抽樣指標與全及指標相對應也有樣本總體的平均數、成數、方差和標準差等。為區別於全及指標,通常以小寫字母表示。

值得注意的是,對於一次確定的統計調查,全及總體是確定的、唯一的,所以全及指標也是唯一確定的;但從一個全及總體中可以抽取許多個不同的樣本,其分布結構總會存在差異,據此計算的抽樣指標也就有所不同,可以看出,抽樣指標是樣本變量的函數,它本身也是隨機變量。

(三)重複抽樣與不重複抽樣要從總體N個單位中隨機抽取一個容量為n的樣本,從抽樣方法上看,可以有重複抽樣和不重複抽樣兩種。

(1)重複抽樣,也稱回置抽樣,它是從總體N個單位中隨機抽取一個單位,經觀察登記後又重新放回原總體中,再從總體中隨機抽取第二個單位進行觀察,如此連續,直到抽足預定單位數n為止。這種抽樣的實質,是進行了n次過程完全相同的實驗(抽樣結果可相同,也可不同),每個單位中選的機會在各次抽樣中都完全相等,在考慮順序的情況下共可抽取Nn個樣本。

·183·經濟統計分析如:當N=4(假設為A、B、C、D四個單位),n=2(即隨機抽取2個單位構成一個樣本)時,若采用重複抽樣的方法,全部可能抽取的樣本數目為:Nn=42=16個,即:AA,AB,AC,AD;BA,BB,BC,BD;CA,CB,CC,CD;DA,DB,DC,DD。

(2)不重複抽樣,也稱不回置抽樣,它是在每次抽出一個單位後,就不再放回參加第二次抽取,這樣連續抽取n次構成一個樣本總體。這種抽樣的實質是:每抽一次總體單位數就少一個,每次抽取的結果都會影響到下一次抽取,所以每個單位的中選機會在各次抽樣中是不相同的,它遵循的有限製的隨機原則。在考慮順序的情況下全部可能抽取的樣本數目是:N!

(N-n)!

如,上例要采用不重複抽樣,則抽樣過程是先從4個單位中選取1個(共有4種取法),再從剩下的3個單位中選取1個(共有3種取法),兩次選取結果構成一個樣本,總計可選取的樣本數為:4×3=12個,它們是:AB,AC,AD;BA,BC,BD;CA,CB,CD;DA,DB,DC。

可見,在總體和樣本容量相同的情況下,抽樣方法不同,可能抽取的樣本數目也不同,重複抽樣的樣本數目總量大於不重複抽樣的樣本數目。

(四)抽樣推斷分析的組織方式抽樣推斷分析按抽樣組織方式的不同,可劃分為以下幾種主要方法:1.簡單隨機抽樣簡單隨機抽樣(也叫純隨機抽樣),就是對全及總體的所有單位不經過任何整理,按隨機的原則直接從總體所有單位中抽取樣本單位的一種抽樣組織形式。特點是:每個樣本單位被抽中的概率相等,樣本的每個單位完全獨立,彼此之間無一定的關聯性和排斥性。

簡單隨機抽樣是其他各種抽樣形式的基礎,通常隻是在總體單位之間差異程度較小和數目較少時才采用這種方法。具體操作有以下三種形式:(1)直接抽選法。如果總體單位數不多或比較集中,可以在現場直接對實物隨機抽取。如從糧堆中隨機取出一些檢驗其含水量,從棉花堆中隨機抓一把檢查其纖維長度等。

(2)抽簽法。首先對總體各單位進行編號,並做成簽(竹簽、紙簽或小球等),混合放置後,用手工隨機摸取或用機械搖出號碼,確定樣本單位。該方法適合於單位數不多的總體,若總體單位數太多,編號做簽的工作量很大,就很難摻和均勻,甚至無法實施。

(3)隨機數表法。它是利用事先編製好的隨機數表來抽取樣本單位,是純隨機抽樣中采用較多的一種方法。

2.等距抽樣等距抽樣(也叫機械抽樣或係統抽樣),就是事先將全及總體各單位按一定標誌排列成為圖形或一覽表式(也就是通常所說的排隊),然後按固定的順序和間隔抽取樣本單位的一種抽樣組織形式。特點是:抽出的單位在總體中是均勻分布的,而且抽取的樣本可少於純隨機抽樣。等距抽樣的隨機性,表現在抽取的第一個樣本單位上,當第一個單位確定後其餘的各個單位也隨之確定了。當研究現象的標誌變異程度大,又不可能抽取更多的單位進行調查時,等距抽樣較簡單隨機抽樣效果更佳。等距抽樣既可以用同調查項目相·184·學習單元八抽樣推斷分析關的標誌排序,也可以用同調查項目無關的標誌排序。常用的無關標誌有時間序列標誌、地理位置標誌、姓氏筆畫標誌等。

3.類型抽樣類型抽樣(也叫分層抽樣),就是對全及總體各單位先按某主要標誌分組,然後再分別從各組中按簡單隨機抽樣或等距抽樣的方法,抽取一定的單位構成樣本的一種抽樣組織形式。這實質上是科學分組和抽樣原理的結合,其特點是:通過劃類分層,把總體中標誌值較接近的單位歸為一組,使各組單位間的差異程度縮小,分布比較均勻,而且在各組中都要隨機抽選單位,使得抽樣總體更加接近於總體分布,提高了樣本的代表性。該方法適用於總體情況複雜、各單位之間差異較大、單位較多的情況。

4.整群抽樣整群抽樣(又稱集團抽樣),就是將全及總體各單位劃分為若幹個群,然後以群為單位從中隨機抽取一些群,對中選群的所有單位進行全麵調查的一種抽樣組織形式。如欲對某鎮農戶進行家計調查,以自然村莊劃分群,抽取若幹個自然村莊,對中選村莊的所有農戶都進行調查。整群抽樣的優點在於組織工作簡單,搜集資料方便容易,節省費用和時間。但當樣本單位比較集中總體的分布不夠均勻時,在其他條件相同的情況下,整群抽樣的樣本代表性可能差一些。為了保證樣本有足夠的代表性,就要適當多抽一些群。因此,整群抽樣適應於群間差異性不大或者不適宜單個地抽選樣本的情形。

主題學習單元二抽樣誤差分析欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍問題導入重複抽樣與不重複抽樣,哪一種抽樣方法的誤差較小?

欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍一、抽樣誤差的概念抽樣誤差,是指由於隨機抽樣的偶然性因素,使樣本結構不足以代表總體結構而引起的抽樣指標與全及指標間的離差。在抽樣調查中,誤差的來源有以下兩類:1.登記性誤差登記性誤差,是指在調查過程中由於主客觀原因而引起的登記性差錯所造成的誤差。

它的產生可能是由於觀察、測量、記錄、計算所引起,也有可能是由於被調查者所報材料不真實(如無知或者有意虛報、瞞報)引起的。登記性誤差是所有統計調查都可能發生的誤差,它可以通過搞好調查的宣傳組織工作、不斷提高調查人員的素質、廣泛采用電子計算機技術等措施加以解決。

2.代表性誤差代表性誤差,是指用樣本指標數值來推算總體指標數值時,由於樣本各單位的結構不·185·經濟統計分析足以代表總體特征所產生的誤差。代表性誤差又可分為兩種:係統性誤差和抽樣誤差。

(1)係統性誤差,是指由於抽樣時違反了隨機性原則,使抽樣指標出現偏高或偏低的情形所造成的誤差,是一種可以避免和預防的誤差。例如,調查者有意挑選較好或較差的單位作樣本。

(2)抽樣誤差,是指由於隨機抽樣的偶然性因素,使樣本各單位的結構不足以代表總體的結構,所引起的抽樣指標與全及指標之間的絕對離差。這類誤差是無法避免的,但可通過數學方法事先計算並加以控製。在計算抽樣誤差時常常假設,不存在登記性誤差和係統性誤差。應當說明的是,抽樣誤差的數值隨樣本不同而變化,它也是一個隨機變量。

3.抽樣調查與全麵調查的誤差比較①抽樣調查既有代表性誤差,也有登記性誤差;全麵調查沒有代表性誤差,隻有登記性誤差。

②全麵調查的誤差從理論上講是可以避免的;抽樣調查的誤差不可避免。

③全麵調查的誤差是無法計算的;抽樣調查的誤差可以事先計算並加以控製。

④全麵調查的誤差來源少,隻有登記性誤差一項,但因調查涉及的麵廣,因而總誤差可能較大;抽樣調查的誤差來源較多,但適當控製後有可能使總誤差較小。

二、影響抽樣誤差的因素影響抽樣誤差的因素,概括起來主要有以下幾個方麵:(1)總體各單位被研究標誌的變異程度。在其他條件不變的情況下,總體各單位的標誌變異程度越小,抽樣誤差也越小。

(2)樣本容量。在其他條件不變的情況下,抽樣單位數(即樣本容量n)越多,抽樣誤差越小,反之則大。

(3)抽樣方法。不同的抽樣方法所抽出的樣本對於總體的代表性不同,誤差也不同。

一般情況下,重複抽樣比不重複抽樣的誤差要大些。

(4)抽樣的組織形式。不同的抽樣組織形式有不同的抽樣誤差,而且同一抽樣組織形式的合理程度不同,也會有不同的抽樣效果。

三、抽樣平均誤差抽樣誤差是一個隨機變量,它的數值隨著可能抽取的樣本不同而變。為了從總體上衡量樣本代表性的高低,就需要計算抽樣誤差的一般水平。抽樣平均誤差,就是反映抽樣誤差一般水平的一個指標,通常用抽樣平均數或抽樣成數的標準差來度量,它反映抽樣平均數或抽樣成數與總體平均數或總體成數的平均誤差程度。

(一)純隨機抽樣組織方式下,抽樣平均誤差的計算1.平均數的抽樣平均誤差(1)重複抽樣條件下:樣本方差σ2σ抽樣平均誤差=即:μx-==槡樣本容量槡n槡n(2)不重複抽樣條件下:·186·學習單元八抽樣推斷分析σ2N-nσ2nx-=當N很大時:x-=1-μ槡n()N-1μ槡n()N2.成數的抽樣平均誤差(1)重複抽樣條件下:(1-)=ppμp槡n(2)不重複抽樣條件下:p(1-p)N-np(1-p)n=當N很大時:=1-μp槡n()N-1μp槡n()N(二)等距抽樣組織方式下,抽樣平均誤差的計算直接計算等距抽樣的平均誤差,在實踐中是一個不易解決的問題。一般分為兩種情況來處理:當總體單位按有關標誌排序時,可采用類型抽樣平均誤差的公式近似計算;當采用無關標誌排序時,可按簡單隨機抽樣平均誤差公式近似計算。

(三)類型抽樣組織方式下,抽樣平均誤差的計算1.平均數的抽樣平均誤差(1)重複抽樣條件下:σ2-=μx槡n2σi·ni其中,σ2=∑,即為各組組內方差的平均值。

∑ni(2)不重複抽樣條件下:σ2nx-=1-μ槡n()N2.成數的抽樣平均誤差(1)重複抽樣條件下:(1-)=ppμp槡n(2)重複抽樣條件下:(1-)n=pp1-μp槡n()N【例】某村采用類型抽樣法進行抽樣調查,試計算抽樣平均誤差。資料如表81所示。

·187·經濟統計分析表81類型抽樣平均誤差計算表按自然條件全部麵積(畝)抽樣麵積(畝)抽樣平均畝產(斤)畝產標準差(斤)-分組Ninixiσi平原4502596022山區1801075040合計63035900282·222σini(22)×25+(40)×10σ=∑==802.86(斤)25+10∑niσ2802.86x-===4.79(斤)μ槡n槡35(四)整群抽樣組織方式下,抽樣平均誤差的計算整群抽樣一般采用不重複抽樣的方法抽取樣本,其抽樣平均誤差的計算公式為:2平均數的群間方差樣本群數δx-rx-=1-=1-μ槡樣本群數(總體群數)槡r()R成數的群間方差樣本群數δ2r=1-=p1-μp槡樣本群數(總體群數)槡r()R--22xi-xi-2∑()2∑()pp其中:δx-=,δ=RpR【例】某企業大量連續生產,為掌握某月某種產品的一級品率,確定抽出5%的產品,即在全月連續生產的720小時中按每隔20小時抽取1小時的全部產品加以檢驗。根據抽樣資料計算知,一級品率為85%,各群間的方差為6%,則整群抽樣的平均誤差的計算如下:R=720小時,r=720小時×5%=36小時,則:2δpr0.0636=1-=1-=0.0398或3.98%μp槡r()R槡36()720需要注意的是,上述計算公式中的總體平均數、總體成數、總體方差,往往難以獲得,故一般用抽樣平均數x-、抽樣成數p和樣本方差s2來代替計算;另一方麵,上述不重複抽樣公式中,若n較小而N很大時,為簡化計算,一般對不重複抽樣也往往采用重複抽樣公式計算其抽樣平均誤差。

四、抽樣極限誤差由於總體指標是一個未知的確定量,而樣本指標是一個隨機變量,隨不同的樣本組合而發生變化,但它總是在總體指標的左右兩側變動,從而產生正離差或負離差。

抽樣誤差範圍,是指變動的樣本指標與確定的全及指標之間離差的可能範圍。它是根據概率理論,以一定的可靠程度保證抽樣誤差不超過某一給定的範圍,統計上把這個給定的抽樣誤差範圍叫作抽樣極限誤差。由於這個誤差範圍往往是實際調查中,人們根據研究對象的差異程度和分析任務的需要而確定的可允許的最大誤差範圍,因此,抽樣極限·188·學習單元八抽樣推斷分析誤差習慣上又稱為允許誤差。

設Δx-與Δp分別表示抽樣平均數極限誤差和抽樣成數極限誤差。則有:-Δx-=x-X,Δp=p-P也可將上列等式變換成下列的不等式關係:-X-Δx-≤x≤X+Δx-,P-Δp≤p≤P+Δp-上式表明,抽樣平均數x是以總體平均數X為中心,在X±Δx-之間變動,區間(X-Δx-,X+Δx-)稱為平均數的估計區間或稱平均數的置信區間,區間總長度為2Δx-。

在這個區間內的抽樣平均數與總體平均數的絕對離差不超過Δx-。同樣,抽樣成數p是以總體成數P為中心,在P±Δp之間變動,抽樣成數在(P-Δp,P+Δp)區間內與總體成數的絕對離差不超過Δp。

由於總體平均數和總體成數是未知的,它隻能依靠實測的抽樣平均數和抽樣成數來-估計。抽樣極限誤差的實際意義是希望總體平均數X落在抽樣平均數x±Δx-的範圍內,總體成數P落在抽樣成數p±Δp的範圍內。因此,上述不等式應該變換為:--x-Δx-≤X≤x+Δx-,p-Δp≤P≤p+Δp五、抽樣誤差的概率度,-基於概率估計理論上的要求抽樣極限誤差通常需要以抽樣平均誤差μx或μp為標。--,,準單位來衡量把抽樣極限誤差Δx或Δp相應除以μx或μp得出相對數t表示誤差範圍為抽樣平均誤差的若幹倍,t稱為抽樣誤差的概率度,它是測量抽樣推斷可靠程度的一個參數,描述抽樣極限誤差與抽樣平均誤差的比例關係。即:-ΔxΔpt=或Δx-=t·x-,t=或Δ=t·-μpμpμxμp由上式可知,在抽樣平均誤差一定的條件下,概率度t的數值愈大,抽樣極限誤差Δ也愈大,抽樣推斷的可靠程度也愈高;相反,t的數值愈小,Δ也愈小,抽樣推斷的可靠程度也就愈低。如果把可靠程度即概率,用P表示,那麼P就是t的函數,也就是P=F(t),表明概率分布是概率度的函數。

從一個全及總體中連續進行多次抽樣,可以得到一係列的樣本,分別求出各個樣本的平均數(或成數),便可形成一個抽樣平均數(或成數)的概率分布。在樣本單位數足夠多(n≥30)的條件下,樣本平均數(或成數)的分布接近於正態分布。在正態分布下,以正態分布曲線下總麵積為1圖81樣本指標置信度圖或100%,F(t)就是所占總麵積的百分比,它可以表現推斷結果的可靠程度,如圖81所示。

·189·經濟統計分析在正態分布下,由於概率是概率度的函數。我們可以通過給定的概率保證程度F(t),查《正態分布概率表》,直接從表中找出相應的概率度t的值。在抽樣推斷中最常用的幾個概率度t與概率之間的函數關係,如表82所示。

表82常用正態分布概率表概率度t概率F(t)概率度t概率F(t)1.000.68272.000.95451.500.86642.500.98761.640.89903.000.99731.960.9500檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺殣殣統計小辭典1.多階抽樣(又稱多級抽樣),就是將調查分成兩個或兩個以上的階段進行抽樣。第一階段先將總體按照一定的規範分成若幹抽樣單位,稱之為一級抽樣單位(或稱初級抽樣單位),再把抽中的一級抽樣單位分成若幹更小的二級抽樣單位,從抽中的二級抽樣單位再分三級抽樣單位等等,這樣就形成一個多階段抽樣過程。特點是,在對超大而又複雜總體調查的抽樣中實施和管理更加方便,且不需要對每級抽樣單位編製完全的抽樣框。

2.二重抽樣(又稱兩相抽樣),就是先抽取一個容量比較大的初始樣本,用初始樣本估計總體的某些參數或某些必要的信息作為分層的比例或再次抽樣的標誌,然後將抽出的初始大樣本作為“總體”,從中抽取容量合適的樣本進行比較詳細的調查。特點是,適合用於對總體信息了解比較少的調查。

3.比率抽樣(PPS抽樣),就是將總體按一種準確的標準劃分出容量不等的具有相同標誌的單位在總體中不同比率分配的樣本量進行的抽樣。特點是總體中含量大的部分被抽中的概率也大,可以提高樣本的代表性。

在抽樣調查的實際工作中,經常是要將幾種抽樣方法結合起來應用。比如,城市居民的收支調查,是將二重抽樣、多階段抽樣、分層抽樣、機械抽樣等多種方法結合起來使用的。

在現實的商業性的市場調查中也有非概率抽樣的應用,如配額抽樣、隨意抽樣、誌願者抽樣、判斷抽樣、修正的概率抽樣和滾雪球抽樣等。由於這些抽樣方法容易出現偏差,因此隻在對共性特別強的群體的商業性調查中應用。

殣(資料來源:國家統計局)檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺殣檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺·190·學習單元八抽樣推斷分析主題學習單元三抽樣推斷欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍問題導入如果把某超市40天的銷售額視為從全年365天中抽取的隨機樣本。假定該超市銷售額服從正太分布,且總體標準差為6,則全年日銷售額95%置信度的區間估計值為多少?

6637.85-1.96×~37.85+1.96×(槡40槡40)欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍抽樣推斷,就是利用實際調查的抽樣資料來推斷全及總體指標的數值。由於總體指標是表明總體數量特征的參數,也稱為參數估計。總體參數的估計方法,有點估計與區間估計兩種。

一、總體參數的點估計總體參數的點估計,是以抽樣指標作為總體指標的估計值,即總體平均數的點估計值就是樣本平均數,總體成數的點估計值就是樣本成數。同時給出抽樣極限誤差和相關的概率保證程度,也叫定值估計。

【例】對一批某種型號的電子元件10000隻進行耐用時間檢查。現隨機抽取100隻,測試的平均耐用時間為1055小時,合格率為91%。我們可以推斷說10000隻電子元件的平均耐用時間為1055小時,全部電子元件的合格率也是91%。

總體參數點估計的方法簡便、易行,但這種估計沒有考慮是否有抽樣誤差,更不能說明誤差在一定範圍內的概率保證程度。要解決這類問題,就要采用區間估計的方法。

二、總體參數的區間估計總體參數的區間估計,是根據樣本指標和一定概率條件下的抽樣極限誤差(允許誤差)去推斷總體參數所在的可能區間範圍(或稱置信區間)。這種估計不僅考慮到抽樣誤差的大小,而且與推斷的把握程度聯係在一起。因此,區間估計是一種科學的估計方法。

用公式表示為:----x-Δx≤X≤x+Δx或p-Δp≤P≤p+Δp(一)根據給定的抽樣誤差範圍,估計概率保證程度具體步驟如下:(1)抽取樣本,根據樣本單位標誌值計算樣本平均數或樣本成數,作為總體平均數或成數的估計值,並計算樣本標準差用以推算抽樣平均誤差。

(2)根據給定的抽樣極限誤差△,估計出總體指標的下限和上限。

(3)根據抽樣極限誤差△和抽樣平均誤差μ,計算概率度t的值,再根據t值查正態·191·經濟統計分析分布概率表,查出相應的概率保證程度F(t)。

【例】某市某年對在職職工年收入進行抽樣調查。隨機抽取1000名職工調查,調查結果為:人均年收入為28000元,標準差為9000元,要求抽樣極限誤差不超過500元,試對該市職工人均年收入進行區間估計。

第一步:計算樣本平均數、標準差和抽樣平均誤差x-=28000(元),s=9000(元)s2s9000μx-====285(元)槡n槡n槡1000第二步:計算總體平均指標的下限和上限-下限=x-Δx-=28000-500=27500(元)-上限=x+Δx-=28000+500=28500(元)第三步:計算概率度,並查表估計出置信度Δx-500t===1.75μx-285查表,得F(1.75)=92%據此,可以說有92%的把握程度估計該市在職職工平均年收入在27500~28500元範圍內。

【例】某市對小學生眼睛近視情況進行調查。現從全市小學生中隨機抽取1000名進行檢查,發現患近視的學生人數比重達到38%,要求抽樣誤差範圍不超過3%,試對該市小學生近視人數的比重進行估計。

第一步:計算樣本成數、方差和抽樣平均誤差P=38%,s2=p(1-p)=38%×(1-38%)=23.56%(1-)0.2356=pp==0.0153或1.53%μp槡n槡1000第二步:計算總體成數的下限和上限下限=p-Δp=38%-3%=35%上限=p+Δp=38%+3%=41%第三步:計算概率度,並查表估計出置信度Δp3%t===1.96μp1.53%查正態分布概率表,得F(1.96)=95%即有95%的概率保證程度,估計該市小學生患近視的人數比重為35%~41%。

(二)根據置信度的要求,估計抽樣極限誤差具體步驟如下:(1)抽取樣本,根據樣本單位標誌值計算樣本平均數或成數作為總體平均數或成數的估計值,並計算樣本標準差用以推算抽樣平均誤差。

(2)根據給定的置信度F(t)的要求,查《正態分布概率表》,求得概率度t值。

(3)根據概率度和抽樣平均誤差計算抽樣極限誤差,並據此計算被估計的總體平均·192·學習單元八抽樣推斷分析數或成數的下限和上限。

【例】某鄉鎮對30000畝水稻隨機抽取5%的麵積進行產量調查。根據樣本實割實測結果,計算出樣本平均畝產為600千克,標準差為155千克,試以95%的把握程度推算全鎮水稻的平均畝產量。

第一步:計算樣本平均畝產量,標準差和抽樣平均誤差x-=600千克,s=155千克s2s155μx-====4(千克)槡n槡n槡30000×5%第二步:根據給定的置信度F(t)=95%,查正態分布概率表,得概率度t=1.96第三步:計算抽樣極限誤差,確定總體平均數的下限和上限Δx-=t·μx-=1.96×4=7.84(千克)-下限=x-Δx-=600-7.84=592.16(千克)-上限=x+Δx-=600+7.84=607.84(千克)據此,可以95%的概率保證估計該鎮水稻平均畝產量為592.16千克~607.84千克。

【例】某縣從80000畝耕地隨機抽取2%的麵積進行調查,結果發現有5%的耕地缺少微量元素鋅,試以95.45%的置信度推斷該農場全部耕地中缺少鋅的麵積所占比重。

第一步:計算樣本成數、方差和抽樣平均誤差p=5%,s2=p(1-P)=5%×(1-5%)=4.75%(1-)4.75%=pp==0.0054或0.54%μp槡n槡80000×2%第二步:根據給定的置信度F(t)=95.45%,查正態分布概率表,得概率度t=2第三步:計算抽樣極限誤差,並確定總體成數的下限和上限。

·Δp=tμp=2×0.54%=1.08%下限=p-Δp=5%-1.08%=3.92%上限=p+Δp=5%+1.08%=6.08%據此,可以95.45%概率保證該縣全部耕地中缺少鋅的麵積所占比重為3.92%~6.08%。

由上述分析計算,我們可看出抽樣誤差範圍的大小決定著抽樣推斷的準確性,概率保證程度的大小決定著抽樣推斷的可靠性。換句話說,就是抽樣誤差的範圍越小,抽樣推斷的準確性越高;抽樣的概率保證程度越大,抽樣推斷的可靠性越大。對同一次抽樣估計而言,若提高抽樣估計的準確性,就會降低其概率保證程度。因此,在設計抽樣方案時應先對估計的準確性提出要求,然後再推斷估計的可靠性;或先對估計的可靠性提出要求,再去推斷可能的誤差範圍。如果推斷的結果不能滿足要求,就應采取增加抽樣數目、改善抽樣組織方式等手段來滿足研究目的。

由Δ=t×μ可知:概率度t、抽樣極限誤差Δ、抽樣平均誤差μ及估計的精確度之間:當μ一定時,t越大,則Δ越大,誤差範圍越大,估計的精確度越小,抽樣推斷的可靠程度加大;反之,抽樣推斷的可靠程度變小。

下麵我們再通過幾個實例,來說明抽樣推斷的具體應用。

·193·經濟統計分析【例】為研究新款服裝的銷路,在市場隨機對500名成年人進行調查。結果有175人喜歡該款服裝,要求以95%的概率保證程度,估計該市成年人喜歡該款服裝的比率範圍。

已知:n=500,p=175/500=0.35根據F(t)=95%,查正態分布概率表可得t=1.96(1-)0.35(1-0.35)=pp==0.0213或2.13%μp槡n槡500·Δp=tμp=1.96×2.13%=4.17%喜歡該款時裝的成年人比重區間為:下限=p-Δp=35%-4.17%=30.83%上限=p+Δp=35%+4.17%=39.17%即喜歡該款時裝的成年人比重區間為30.83%~39.17%,做出這一推斷的把握程度為95%。

(三)根據置信度的要求,確定抽樣單位數【例】某公司欲對某種型號的10000個電子元件的耐用時間進行檢查,根據以往資料可知該型號電子元件耐用時間的標準差為800小時,若要求概率保證程度為95.45%,抽樣誤差範圍不超過200小時,則需要抽選多少個電子元件檢查?

已知:N=10000個,s=800小時,F(t)=95.45%,t=2,Δx-=200小時所以,在重複抽樣條件下,應抽取的樣本單位數為:s∵Δx-=t·μx-=t·槡nt2·s222×8002∴n=2=2=64(個)Δx-200在不重複抽樣條件下,應抽取的樣本單位數為:s2n∵Δx-=t·x-=t·1-μ槡n()NN·t2·s210000×22×8002∴n=222=222=63(個)NΔx-+ts10000×200+2×800【例】某公司欲對某種型號的10000個零件的質量特性進行檢查,根據以往調查資料得知產品合格率為96%,要求以95.45%的概率保證程度,抽樣誤差範圍不超過4%時,試確定需要抽取的零件個數?

已知:N=10000個,P=96%,F(t)=95.45%,t=2,Δp=4%在重複抽樣條件下,應抽取的樣本單位數為:p(1-p)∵Δ=t·=tpμp槡nt2·P(1-P)22×96%×(1-96%)∴n=2=2=96(個)Δp(4%)在不重複抽樣條件下,應抽取的樣本單位數為:·194·學習單元八抽樣推斷分析p(1-p)n∵Δ=t·=t(1-)pμp槡nNNt2P(1-P)10000×22×0.96×0.04∴n=22=22=95(個)NΔp+tP(1-P)10000×0.04+2×0.96×0.04【例】某進出口公司出口一種名茶,規定每包茶葉的重量不得低於150克,現用不重複抽樣的方法抽取其中1%進行檢驗。若總包數為1萬包,平均重量為150.3克,方差為0.76克,抽樣檢查結果如表83所示。

表83某進出口公司出口茶葉抽檢結果表每包茶葉重量(克)組中值(克)抽檢包數(包)148~149148.510149~150149.520150~151150.550151~152151.520要求:(1)試以99.73%概率估計這批茶葉平均每包的重量範圍?

(2)用同樣的概率估計這批茶葉包裝的合格率範圍?

已知:n=100=1%N,N=100/1%=10000,F(t)=99.73%,t=3,則:xf148.5×10+149.5×20+150.5×50+151.5×2015030x-=∑===150.3(克)∑f10+20+50+20100(x-x-)2fs=∑槡∑f(148.5-150.3)2×10+(149.5-150.3)2×20+(150.5-150.3)2×50+(151.5-150.3)2×20=槡10+20+50+2076==槡0.76=s2槡100s2n0.76100-=1-=1-=0.087(克)μx槡n()N槡100()10000Δx-=t·μx-=3×0.087=0.261(克)--X=x±Δx-=150.3±0.261(克)該批茶葉平均每包的重量在150.039~150.561克,做出這種估計的把握程度為99.73%。

因為,規定每包茶葉的重量不得低於150克,凡是達不到這個標準的均為不合格品,則有:50+20p(1-p)0.7×0.3p==0.7===0.0458100μp槡n槡100·Δp=tμp=3×0.0458=0.137P=p±Δp=0.7±0.137,即(0.563~0.837)·195·經濟統計分析因此,以99.73%的概率保證程度估計,這批茶葉的合格品率為56.3%~83.7%。

學習單元八課後練習題一、單項選擇題1.抽樣調查的目的在於()。

A.了解樣本的基本情況B.對全及總體進行全麵調查C.了解總體的基本情況D.用樣本指標推斷總體指標2.抽樣誤差是指()。

A.隨機性的代表性誤差B.調查中產生的登記性誤差C.調查中產生的係統性誤差D.計算過程中產生的誤差3.抽樣調查與典型調查均屬非全麵調查,它們之間的主要不同之處在於()。

A.選取調查單位的方式不同B.調查單位的意義不同C.誤差的確定方法不同D.調查的目的不同4.重複抽樣的抽樣平均誤差()。

A.小於不重複抽樣平均誤差B.大於不重複抽樣平均誤差C.等於不重複抽樣平均誤差D.與不重複抽樣平均誤差不能直接比較5.可用樣本成數估計總體成數是因為()。

A.二者的名稱是相似的B.二者的計算方法是一致的C.這種估計滿足優良估計的三個標準D.沒有其他估計量可供選擇6.成數與成數方差的關係是()。

A.成數越接近1,成數方差越大B.成數越接近0,成數方差越大C.成數越接近0.5,成數方差越大D成數越接近0.25,成數方差越大7.重複抽樣在總體方差不變的情況下,要使抽樣誤差範圍減小為原來的一半,則樣本單位數必須()。

A.減小為原來的1/2B.增大為原來的2倍C.增大到原來的8倍D.增大到原來的4倍8.抽樣調查所必須遵循的原則是()。

A.準確性原則B.隨機性原則C.可靠性原則D.隨意性原則9.反映抽樣指標與總體指標之間抽樣可能範圍的指標是()。

A.抽樣極限誤差B.抽樣平均誤差C.概率保證程度D.概率度10.在抽樣推斷中,抽樣誤差()。

·196·學習單元八抽樣推斷分析A.可以避免,也可以控製B.可以避免,但不可以控製C.不可以避免,但可以控製D.既不能避免,也不能控製11.抽樣誤差是由於()引起的。

A.破壞了隨機性原則B.樣本容量過小C.觀察、測量、計算的誤差D.抽樣過程中的偶然因素12.根據抽樣調查的資料表明,某企業生產定額平均完成百分比為165%,抽樣平均誤差為1%,概率是0.9545。可據以確信生產定額平均完成百分比為()。

A.不小於167%B.不大於167%和不小於163%C.不大於167%D.不大於166%和不小於164%13.從某企業全部5000名職工中,先按姓氏筆畫順序編號,然後每隔50人抽取1人,共抽取100人組成抽樣總體,進行家庭收入水平的調查,此調查屬於()。

A.簡單隨機抽樣B.機械抽樣C.類型抽樣D.整群抽樣14.對400名學生隨機抽取19%進行不重複抽樣,其中優等生比重為20%,概率為0.9545,優等生比重的抽樣極限誤差為()。

A.4.0%B.4.13%C.9.18%D.8.26%15.某市為了解城市從業人員的經濟收入,分別從工人、機關職員、個體勞動者和其他職工按大體相同的比例,隨機抽取了2000人進行調查,這種抽樣組織形式屬於()。

A.簡單隨機抽樣B.機械抽樣C.類型抽樣D.整群抽樣16.有一批出口茶葉共200箱,每箱50盒,規定每盒茶葉重量不低於250克,現隨機抽取10箱進行檢驗,此檢驗屬於()。

A.簡單隨機抽樣B.機械抽樣C.類型抽樣D.整群抽樣二、多項選擇題1.從一個全及總體中抽取一係列樣本,則()。

A.樣本指標的數值不是唯一確定的B.樣本指標是樣本變量的函數C.樣本指標是隨機變量D.總體指標是隨機變量E.樣本指標是隨樣本的不同而變化的2.抽樣調查是()。

A.搜集統計資料的方法B.對總體進行科學估計和推斷的方法C.統計調查的方法D.統計整理的方法E.統計分析的方法3.抽樣的方法有()。

A.重複抽樣B.不重複抽樣C.簡單隨機抽樣D.類型抽樣E.機械抽樣4.從全及總體5000個單位中,隨機抽取100個單位進行調查()。

·197·經濟統計分析A.樣本容量是100個B.樣本數是100個C.樣本單位數是100個D.樣本可能數是5000個E.樣本必要數是5000個5.重複抽樣中()。

A.每次試驗是在完全相同的條件下進行B.各單位是否中選在各次抽樣中機會相等C.各次抽選不相互獨立D.各次抽選相互獨立E.各次抽選相互影響6.影響抽樣誤差大小的因素主要有()。

A.抽樣的組織形式B.樣本單位的抽取方法C.總體被研究標誌的差異程度D.抽樣單位數的多少E.抽取的樣本的代表性7.影響樣本容量的因素有()。

A.全及總體標準差的大小B.所要求的把握程度的大小C.樣本單位的抽取方法D.抽樣的組織形式E.樣本單位數的多少8.下麵屬於隨機變量的是()。

A.全及平均數B.抽樣誤差C.抽樣成數D.抽樣平均數E.樣本指標9.是非標誌的()。

A.算術平均數是PB.方差是P(1-P)C.平均數是P(1-P)D.標準差是PE.標準差是P(1-P)三、判斷題1.抽樣調查是對部分單位進行的調查,但目的並不是了解這部分單位的情況。

()2.隨機性原則是統計調查的基本原則。()3.抽樣推斷的全過程就是抽樣調查。()4.抽樣推斷是運用概率估計的方法。()5.進行普查時,不能用抽樣法。()6.抽樣誤差是隨機的,但抽樣指標是唯一確定的。()7.調查誤差分為登記性誤差和代表性誤差。()8.無論全麵與非全麵調查,都會出現登記性誤差。()9.代表性誤差在非全麵調查中都可事先計算並加以控製。()10.抽樣誤差是指隨機性的代表性誤差。()11.抽樣誤差產生的原因是違反了隨機性原則。()·198·學習單元八抽樣推斷分析12.抽樣調查與典型調查的根本區別在於兩種調查選取調查單位的方法不同。

()13.抽樣調查與重點調查的主要不同之處在於選取調查單位的方法不同。()14.抽樣極限誤差就是抽樣允許的誤差範圍。()15.抽樣估計的可靠性增大就意味著估計的精確度降低了。()16.抽樣估計的三要素是估計值、抽樣誤差範圍、概率保證程度。()四、計算分析題1.某市進行職工家計調查,隨機抽取900戶職工家庭。調查得每戶年平均耐用消費品支出為450元,標準差是120元,要求以95%的概率保證程度估計該城市職工平均每產年耐用消費品支出額的範圍?

2.為研究某種新款時裝的銷路情況,在市場上隨機對500名青年女性進行調查,結果有350人表示喜歡這種新款時裝。要求以85%的概率保證程度,估計該市青年女性喜歡這種服裝款式的比率?

3.對一批進口家用電器按不重複抽樣方式,抽選100台進行檢驗,發現其中有4台質量不合格。此次抽查的樣品占該批進口家用電器總量的1%。當概率度為1.96時,可否認為該批進口家用電器的合格率不低於96%?

4.如果成數方差未知,為使全及成數和抽樣成數的誤差不超過3%,在95%的概率保證下,隨機重複抽樣單位數應為多少?

5.某企業某月對所生產的2#電池的電流強度進行1‰的抽樣調查,結果見下表:電流強度(A)抽查電池個數(個)4.5以下24.5~5.045.0~5.5515.5~6.0396.0~6.536.5以上1合計100另按國標規定,2#電池的電流強度須大於5安培才算合格。試以91%的可靠程度,判斷該批2#電池的電流強度是否達到國標要求,並以同樣的可靠程度估計該批2#電池的合格品率的範圍。

6.某市組織了一次職工家計調查。在全市1萬戶居民家庭中不重複抽取了一個容量為400戶的簡單隨機樣本。計算得樣本平均每月每戶人均生活費支出是52.4元。據曆史資料,該市居民家庭月人均生活費支出的標準差是26.3元,試以95%的可靠程度估計該市居民家庭月人均生活費支出的範圍?

7.對某瓷磚廠生產的一萬塊瓷磚進行質量抽查,從中隨機抽取600塊瓷磚進行檢驗,結果其中不合格的有18塊,試用兩種方法分別計算不合格品率的抽樣平均誤差。若·199·經濟統計分析都是以95.45%的保證概率,其不合格品率的區間範圍各是多少?

8.對某磚廠產品質量進行抽樣調查,要求抽樣不合格品率誤差不超過1.11%,概率為95.45%,且知過去進行的幾次同樣調查所得不合格品率分別是1.25%、1.23%、1.14%。試確定必要的抽樣單位數目。

9.不重複抽樣調查某批產品中的90件,其中合格品為81件,若這批產品共900件,試估計其中合格品件數在783件到837件之間的可靠程度是多少?

10.在純隨機重複抽樣中,若要求抽樣誤差減小為原來的25%與50%,則抽樣單位數各應如何改變?

11.從某火柴廠倉庫中隨機抽取100盒火柴進行檢查,結果發現平均每盒火柴為99支,樣本標準差為3支。若可靠程度為99.73%,試估計該企業倉庫中庫存火柴平均每盒火柴支數的範圍。如果允許誤差減小到原來的1/2,可靠程度不變,問需抽多少盒火柴?

12.對一批零件,按不重複隨機抽樣的方式抽選250件,其中廢品10件。又知抽樣是該批零件總量的二十五分之一,當概率為95.45%,可否認為該批零件的廢品率不超過5%?並估計廢品量的區間範圍。

·200·學習單元九相關與回歸分析擬實現的能力目標:N1.1能進行研究對象的相關分析;N2.1能進行研究對象的直線回歸分析;N3.1能進行研究對象的曲線回歸分析並掌握簡單直線回歸的方法原理;理解估計標準誤差的概念及計算方法。

須掌握的知識內容:Z1.1相關關係與函數關係;Z1.2相關關係種類;Z1.3線形相關係數計算及相關程度判斷分析;Z2.1回歸係數計算及分析判斷;Z2.2回歸方程的擬合及分析計算;Z2.3估計標準誤的計算及預測結果的準確性分析;Z3.1回歸方程的擬合及分析計算。

引導案例膠卷保存時間與感光速率用於衡量攝影材料感光度的測光計,可以提供許多有關於膠片特性的信息,比如它的曝光時間和曝光範圍。在寶麗來中心感光實驗室中,科學家們把即時顯像膠片置於一定的溫度和濕度下,使之近似於消費者購買後的保存條件,然後再對其進行係統的抽樣檢驗和分析。他們選擇專業彩色攝影膠卷,分別抽取了已保存1~13個月不等的膠卷,以便研究它們保存時間和感光速率之間的聯係。數據顯示,感光速率隨保存時間的延長而下降,他們之間相應變動的關係可用一條直線或線性關係近似表示出。運用回歸分析法,寶麗來公司建立了一個方程式,它能反映出膠卷保存時間長短對感光速率的影響。y=-19.8-7.6x式中:y———表示膠卷感光率的變動x———表示膠卷保存時間(月)從這一方程式中可以看出,膠卷的感光速率平均每月下降7.6個單位。通過此分,,,析得到的信息有助於寶麗來公司把消費者的購買和使用結合起來考慮調整生產提供顧客需要的膠卷。(資料來源:豆丁網www.ldxy.cn)·201·經濟統計分析主題學習單元一相關分析欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍問題導入若居民收入增加,居民消費額也增加,則居民收入和居民消費額之間存在何種關係?

欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍一、相關關係的概念對現象之間或現象中各個標誌之間的關係進行研究,一般是通過相應的變量之間的關係來度量的。變量之間的關係,通常可分為確定性關係和非確定性關係兩種類型,它們各有其不同的特點。

(一)確定性關係確定性關係,是指在一定條件下,現象間存在著嚴格的依存關係,即自變量每取一個數值,相應的因變量必然有一個確定的值與之對應,即y是x的函數,這種關係也稱為函數關係。

如,若銀行的1年期存款利率為年息1.98%,存入的本金用x表示,到期本息用y表示,則有:y=x+0.0198x(不考慮利息稅)又如,某種股票的成交額Y與該股票的成交量X、成交價格P之間的關係,可以用下述關係式表示:Y=P·X再如,圓麵積(s)與它的半徑(r)之間的關係,可用下述關係式表示:s=π·r2一般說來,任意兩個變量x與y之間的函數關係,可寫成:y=f(x)或f(x,y)=0變量y與n個變量x1,x2,…,xn之間的函數關係,可寫成:y=f(x1,x2,…,xn)或f(x1,x2,…,xn,y)=0在自然界中,這種確定性關係在各種現象之間廣泛存在著。但在社會經濟現象中,由於受到眾多不易控製因素的影響,實際所觀測到的數值並不能完全呈現出函數關係,大多數情況下表現為非確定性關係。

(二)非確定性關係非確定性關係,是指現象間確實存在的、關係數值不固定的相互依存關係,即當某一現象的數量確定了,另一現象的變量還可能在一定範圍內有所變化,我們把這種依存關係稱為非確定性關係,也稱為統計相關或相關關係,簡稱相關。

如,成本的高低與利潤的多少有密切的關係,但某一確定的成本與相對應的利潤的數量關係卻是不確定的。這是因為,影響利潤的因素除了成本外,還有價格、供求平衡、消費·202·學習單元九相關與回歸分析嗜好等因素以及其他偶然因素的影響;再如,生育率與人均GDP的關係也屬於典型的相關關係。人均GDP高的國家,生育率往往較低,但二者沒有唯一確定的關係。這是因為,除了經濟因素外,生育水平還受教育水平、城市化水平以及不易測量的民族風俗、宗教和其他隨機因素的共同影響。

二、相關關係的主要特征與種類相關關係是現象間確定存在的,關係數值不固定的相互依存關係。其主要特征表現為:某一現象的標誌與另外某一標誌之間存在著一定的依存關係,但這種關係不是確定和嚴格依存的;在這種關係中,某項標誌的每一數值都有另外標誌的一定數值與之對應;在這種關係中,對應的數值間表現出一定的波動性,但總是圍繞著它們的平均數和一定的規律在變動。

相關關係的研究,通常在相互聯係的兩個現象中,將其中一個起影響作用的現象具體化,並通過一定的標誌反映出來,把此標誌稱為自變量;把由於受到自變量變動的影響,而發生變動的另一個標誌稱為因變量。一般情況下,可采取如下方法確定相關關係中的自變量和因變量。

當兩個變量之間存在明顯的因果關係時,把引起結果的原因作為自變量(x),把形成的結果作為因變量(y)。在這種情況下,自變量和因變量不能互換,如人的身高與體重的關係;當變量之間存在並不明顯的因果關係時,自變量(x)與因變量(y)要根據研究目的來確定,在這種情況下,兩者可以互換,但所說明的問題就不相同了。相關關係可按不同的標誌進行分類:1.按變量之間相關關係方向不同的分類(1)正相關,即在相關關係中,當變量x的值增加,變量y的值也相應地隨之有增加趨勢的相關關係。如,員工勞動生產率提高,產品產量也隨之增加;居民的消費水平隨個人所支配收入的增加而增加等。

(2)負相關,即在相關關係中,當變量x的值增加,變量y的值隨之而有減少趨勢的相關關係。如,在企業的生產經營中,隨著產品產量的增加,產品單位固定成本有下降的趨勢;商品流轉額越大,商品流通費用越低;利潤隨單位成本的降低而增加等。

2.按變量之間相關關係表現形式不同的分類(1)直線相關,即當變量x發生變動,變量y的值也隨之發生大體均等的變動(增加或減少),其圖形大致表現為一條直線的相關趨勢,又稱線性相關。如,人均消費水平與人均收入水平通常呈線性關係等。

(2)曲線相關,即當變量x發生變動,變量y的值也隨之發生不均等的變動(增加或減少),在圖形上大體表現為各種曲線的相關趨勢,又稱非線性相關。如,工人加班加點在一定數量界限內,產量增加;但一旦超過一定限度,產量反而可能下降,這就是一種非線性關係。

3.按變量間相關程度不同的分類(1)完全相關,即當變量y完全隨變量x的變動而相應變動。如,在價格不變的條件下,銷售額與銷售量之間的正比例函數關係即為完全相關,此時相關關係便成為函數關·203·經濟統計分析係。因此,也可以說函數關係是相關關係的一個特例。

(2)零相關:即在變量之間完全不存在任何依存關係,也就是當變量x變動後,變量y完全不隨之作相應變動,又稱無相關或不相關。如,股票價格的高低與當地氣溫的高低一般情況下是不相關的。

(3)不完全相關,即介於完全相關和零相關之間的關係。由於完全相關和不相關的數量關係是確定的或相互獨立的,因此統計學中相關分析的主要研究對象是不完全相關。

4.按相關關係涉及變量(或因素)多少的分類(1)單相關,是指兩個變量之間的相互關係,即一個變量y與一個變量x之間的相互依存關係,又稱一元相關。如,廣告費支出與產品銷售量之間的相關關係等。

(2)複相關,是指多個變量之間的相互關係,即一個變量y與其他兩個或兩個以上變量x間複雜的相互依存關係,又稱多元相關。如,商品銷售額與居民收入、商品價格之間的相關關係等。

(3)偏相關,是指在一個變量與兩個或兩個以上的變量相關的條件下,當假定其他變量不變時,其中兩個變量間的相關關係稱為偏相關。如,在假定商品價格不變的條件下,該商品的需求量與消費者收入水平的相關關係即為偏相關。

現象間的相關關係,如圖91所示。

圖91現象間的相關關係示意圖三、相關分析的內容與作用相關分析,是研究兩個或兩個以上變量之間相關關係的密切程度與方向的一種統計分析方法。相關分析的內容,主要有:定性判斷現象間有無相關關係(一般通過畫散點圖來判斷);編製相關圖表,明確現象間相關關係的表現形式;計算相關係數等分析指標,測定現象相關關係的密切程度和方向。

·204·學習單元九相關與回歸分析判斷現象間有無相關關係,應做到:一是現象間的相互關係必須是真實的,是具有內在聯係的,而不是巧合或臆造的;二是要根據有關的科學理論,通過觀察和試驗,在對現象做深入分析的基礎上,判斷有無相關關係。

本章在進行相關分析時,主要是針對線性相關關係的。為了形象地描述兩個變量之間的關係,如上所述,常用的方法就是作散點圖,即將自變量x的數值列在橫坐標,將因變量y的數值列在縱坐標,每一對數值在圖上對應於一點,所有這些點便構成了散點圖,如圖91所示。通過觀察圖中點的分布、走向和散布程度,可近似地反映出兩個變量相互關係的類型、變動方向和密切程度。

檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺殣殣閱讀材料囚徒困境甲乙是同案犯,被隔離審訊。如果兩人都不招,隻能各判一年,因為證據不充分。如果隻有一方招供,屬立功表現,功罪相抵,無罪釋放;而另一方則屬抗拒從嚴,重判十年。但如果兩人都招供,則各判五年。結果由於兩人都怕對方先招,使自己處於不利地位,都想搶先招供。結果是:兩個人爭先恐後地都招了,各自判五年。這就是在博弈論入門第一章中,一般都要介紹的“囚徒困境”。

“囚徒困境”在經濟學上的意義在於:它告訴我們,隻從自己的角度出發,考慮自己的利益最大化,這種基於個人理性選擇的結果往往適得其反,導致整體利益的最小化。由此不難理解,為什麼有那麼多的廠家每年樂此不疲地挑起一輪又一輪的價格戰?因為,處於買方市場環境下,同一行業中每一家企業都處於“囚徒困境”中。

作為生產企業,自然希望大家都不降價。這樣,大家的利潤都有保證。但是,誰又能替別人做主呢?由於大家都有強烈的擴大市場占有率的衝動,誰先降價,誰就占有主動,其市場份額就可以迅速地擴大,其他企業隻好喝西北風了。這種情況下,隻好搶先降價,而其他企業隻得緊緊跟隨,甚至變本加厲。最後,大家扯平,進入一個相對平衡狀態,等待下一個“囚徒”出現,前麵的情形再重演一遍。同樣,股市暴跌股民競相殺跌出逃時、央視每年的廣告招標大會上,都可以看到“囚徒困境”的影子。

殣(資料來源:《大眾投資指南》2003.2)檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺殣檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺這裏要特別指出的是,相關係數γ隻表示變量x與變量y間線性相關的密切程度。

當γ值很小甚至為0時,並不一定表示變量x與變量y不存在其他非線性關係。

相關分析作為一種非常有用的統計分析方法,其作用主要有:可確定變量間相關關係的種類、密切程度及變動方向;作為一種因素分析方法,可對複雜現象的變動進行分析和研究;可為統計預測提供參考信息。

四、相關係數的測定相關係數是一個絕對值在0與1之間的係數,其數值的大小可反映兩個變量之間相關關係密切程度和相關方向的統計分析指標,用γ表示。

當兩個現象間為線性相關時,其計算公式為:·205·經濟統計分析nxi·yi-xi·yiγ=∑∑∑2()22()2槡(n∑xi-∑xi)-槡(n∑yi-∑yi)式中,γ———代表相關係數x———代表自變量y———代表因變量相關關係的數值有一定的範圍,即|γ|≤1。當|γ|=1,表示x與y為完全線性相關,即為確定的函數關係;|γ|=0,表示兩變量不存在線性相關;0<|γ|<1時,表示兩變量存在不同程度的線性相關。根據經驗,通常可以確定一個對相關程度評價的標準分類:0<|γ|≤0.3為微弱相關;0.3<|γ|≤0.5為低度相關;0.5<|γ|≤0.8為顯著相關;0.8<|γ|<1為高度相關。

【例】某企業某年上半年產品產量與產品單位成本資料,如表91所示。試確定產品產量與產品單位成本間的相關程度與方向。

表91某企業產品產量與產品單位成本關係分析表產量(噸)單位成本(元/噸)計算欄月份xyx2x·yy2127341465329237292165184347116284504143739219532954691627647616568253404624合計2142679148130268由表91資料可大致觀察出,隨著產品產量的增加,其產品單位成本呈下降趨勢,近似表現出一種線性相關趨勢(散點圖略),即γ<0,則:nxi·yi-xi·yiγ=∑∑∑2()2·2()2槡(n∑xi-∑xi)槡(n∑yi-∑yi)6×1481-21×426==-0.91槡(6×79)-(21)2·(槡6×30268)-(426)2由此可見,該企業產品產量與產品單位成本間,具有高度負相關關係。

這裏需進一步說明的是,相關關係與函數關係既有區別又有聯係。兩者的區別表現在:函數關係中變量間的關係值是固定的,且必有一個自變量x與一個因變量y;相關關係中各變量的關係值是不固定的,且兩變量均為隨機變量。兩者的聯係在於:由於觀測或·206·學習單元九相關與回歸分析測量誤差等原因,函數關係在實際中往往通過相關關係表現出來;在研究相關關係時,又要經常借助於函數關係建立數學模型來進行定量分析。

主題學習單元二回歸分析欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍問題導入一線型回歸方程為:^y=7-3.5x,則當變量x每增加1個單位時,變量y如何變化?

欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍一、回歸分析的特點相關係數是說明在線性相關條件下兩個現象相關的方向和相關的緊密程度,這隻是研究相關問題的一個方麵,但它不能指出兩變量相互關係的具體形式,也無法進行數量上的推算。因此,相關分析的另一方麵,就是要研究變量之間數量變化的一般關係。

回歸分析,是把變量間的變動關係加以模型化,利用觀測的樣本資料計算出回歸方程,即配合相應的直線或曲線(直線稱為回歸直線方程,曲線稱為回歸曲線方程),以便進行估計推算的分析方法。這裏的回歸方程,是指把兩個或兩個以上變量間的變動關係給予模型化而得到的數學方程式。回歸方程確定後,就可以根據自變量x的數值來推測因變量y的數值。回歸方程如果是線性的,就稱為線性回歸方程,否則就稱為非線性回歸方程。簡單線性回歸方程,是指描述兩個變量之間直線關係的方程,是回歸方程中應用最廣泛的數學方程式。

回歸分析歸納起來,具有如下特點:(1)兩變量之間不是對等關係,即自變量x和因變量y在進行回歸分析時,經常要根據研究目的或現象間內在關係來確定;(2)通過自變量x與因變量y的觀察數值關係確定的回歸方程,是兩個變量間的具體的變動關係,而不是抽象的數學關係;(3)自變量x和因變量y這兩個變量中,存在兩個回歸方程,一個是以x為自變量、y為因變量的“y依x的回歸方程”,一個是以y為自變量,x為因變量的“x依y的回歸方程”,這是兩個斜率不同的方程式;(4)回歸係數(即回歸方程中參數b)有正、負號,正號說明兩個變量間是同方向變動,即直線上升;負號說明兩個變量間是反方向變動,即直線下降;(5)回歸方程要求,因變量是隨機變量,自變量是給定的數值。

二、線性回歸方程的確定前已述及,根據試驗或觀察數值繪製散點圖,其主要作用是形象直觀地描繪出兩個變量間相互關係的基本形式,以便大致確定相互關係的數學方程式,即構造回歸方程,從而對變量間的變動關係作進一步的分析。

·207·經濟統計分析如果從散點圖或相關的數據表中可大致觀察出兩變量間呈直線趨勢,可以初步判定兩變量間存在線性關係,可配合一直線方程進行擬合,即:^yi=a+b·xi式中:a———縱截距b———直線斜率,即回歸係數其中:nxi·yi-xi·yib=∑∑∑2()2n∑xi-∑xyixia=∑-b·∑nn我們仍以表91為例,確定該企業產品單位成本依產品產量的回歸方程如下:nxi·yi-xi·yi6×1481-21×426b=∑∑∑==-1.82(元/噸)2()26×79-()212n∑xi-∑xyixi42621a=∑-b·∑=--1.82·=77.37(元)nn6()6即回歸方程為:^y=77.37-1.82x上述回歸方程中各係數的經濟含義為:縱截距a=77.37,表示企業生產該產品的單位固定成本為77.37元,回歸係數b=-1.82元/噸,表示企業該產品每增產1噸,其產品單位成本平均下降1.82元。

需說明的是,回歸係數與相關係數之間存在下述關係,在實際應用時可相互換算。

22nyi-(yi)b=γ∑∑2()2槡n∑xi-∑xi22nxi-(xi)γ=b∑∑2()2槡n∑yi-∑yi三、估計標準誤差的測定當我們在研究兩個變量的直線關係時,根據線性回歸方程,按給定的自變量x的值,可以推算估計出相應的因變量y的數值。而估計值^y與其對應的實際觀測值y之間往往存在一定的離差,我們把這種離差稱為估計誤差。這種估計誤差的大小,可以反映回歸方程估計結果的準確程度,也可以同時反映出回歸直線代表性的大小。估計標準誤差sy越大,觀察值^y在回歸直線周圍分布的離散程度越大,線性回歸方程應用的精確度越低;^相反,sy越小,觀察值y在回歸直線周圍分布的離散程度越小,線性回歸方程應用的精確度越高。

--一般認為,若(sy/y)<15%,說明線性回歸方程應用精確度高;若(sy/y)>15%,說明線性回歸方程應用精確度低。

^當回歸直線方程為yi=a+b·xi時,因有y、x兩個參數,故m=2,則其估計標準誤·208·學習單元九相關與回歸分析差,可用下式表示:^2^22()yi-yi()yi-yyi-ayi-byi·xis=∑=∑=∑∑∑y槡n-m槡n-2槡n-2式中,sy———代表估計標準誤差根據表91中的資料,計算估計標準誤差為:2∑yi-a∑yi-b∑yi·xis=y槡n-230268-(77.37×426)-[(-1.82)×1481]==0.97(元)槡6-2y426∵y-=∑==71n6sy0.97=×100%=1.37%y-71因為,估計標準誤差小於15%,因此,所確定的回歸方程具有較高的精確性。

下麵我們再結合一個例子,說明回歸分析方法的應用。

【例】某企業從有關資料中發現廣告投入和產品銷售有著較密切的關係。近年該企業廣告費和銷售額資料見表92。若今年廣告費的預算為120萬元,試用一元回歸分析法預測本年該企業的產品銷售額。

表92某企業廣告投入與產品銷售額資料計算欄廣告投入xi產品銷售額yi年份(萬元)(百萬元)·22xiyixiyi第一年35186301225324第二年522513002704625第三年603018003600900第四年7238273651841444第五年8541348572251681第六年8044352064001936第七年9549465590252401第八年100525200100002704第九年105606300110253600合計684357296265638815615則根據上述公式計算為:nxi·yi-xi·yi9×29626-684×357b=∑∑∑==0.56632()29×56388-(684)2n∑xi-∑x·209·經濟統計分析yixi357684a=∑-b·∑=-0.5663×=-3.3721nn99^一元回歸預測方程為:yi=-3.3721+0.5667xi企業廣告投入與產品銷售額之間的相關係數為:nxi·yi-xi·yiγ=∑∑∑(2()2)(2()2)槡n∑xi-∑x-槡n∑yi-∑y9×29626-684×357==0.9856槡(9×56388)-(684)2·(槡9×15615)-(357)2相關係數為0.986,說明企業廣告費和銷售額之間是高度線性相關的,可進行預測。

預測誤差為:^22(yi-yi)yi-ayi-byi·xis=∑=∑∑∑y槡n-2槡n-215615-(-3.3721)×357-0.5663×29626==2.439槡9-2sy2.439=×100%=6.15%<15%,回歸預測方程的預測精度高。

y-(357/9)當今年廣告費的預算為120萬元時,本年該企業產品的銷售額預計將達到:^y=-3.3721+0.5667×120=64.63(百萬元)四、運用回歸分析時應注意的問題在實際運用回歸分析法時,應注意這樣幾個方麵的問題:(1)在定性分析的基礎上進行定量分析,是保證正確應用回歸分析的必要條件;(2)一般回歸方程隻宜用於內插推算,不宜做外推預測;(3)回歸係數的絕對值大小受變量計量單位的影響,因此,它隻能反映兩變量變動的比例關係,不表示其聯係的密切程度;(4)對所求出的回歸方程中參數的有效性,應進行顯著性檢驗,以判明其代表性如何。

需進一步說明的是,相關分析與回歸分析兩者既有聯係又有區別。

相關分析與回歸分析的聯係,表現在以下兩個方麵:(1)相關分析與回歸分析的研究對象是一致的,都是研究變量間的相互關係。

(2)相關分析與回歸分析是研究現象間相互依存關係的不可分割的兩個方麵。一般是先進行相關分析,測定現象間相關程度的大小和相關方向,進而決定是否需要進行回歸分析並擬合相應的回歸方程進行推算和預測等。因而可以說相關分析是進行回歸分析的基礎,回歸分析是把變量的相關關係轉變為函數關係的手段。

相關分析與回歸分析的區別,表現在以下方麵:(1)相關關係泛指兩個變量之間的依存關係,不必確定出何者是自變量或因變量,兩個變量是對等關係,均為隨機變量;回歸分析中,必須根據研究目的,分別確定其中的自變·210·學習單元九相關與回歸分析量和因變量,兩個變量不是對等關係,因變量y是隨機變量,自變量x是給定的值,所以回歸關係是指有一定方向的關係。

(2)相關係數是說明兩個變量相關關係的指標,其數值的大小反映兩個變量之間相關的緊密程度和方向,並且相關的兩個變量必須是隨機的,因而改變兩個變量的位置,並不影響相關關係的數值和相關的方向;回歸分析是將相關現象的相關關係轉變為函數關係,並建立變量間關係的數學表達式,來研究變量之間數量依存關係,要求因變量y是隨機的,自變量x是給定的數值,並將自變量x的數值代入回歸方程,求出估計的因變量y的數值,反映變量值之間的具體數量變動關係,所得出的結果並不是抽象的數值。

五、多元線性回歸分析在市場的經濟活動中,經常會遇到某一市場現象的發展和變化取決於幾個影響因素的情況,也就是一個因變量和幾個自變量有依存關係的情況。而且,有時幾個影響因素主次難以區分,或者有的因素雖屬次要,但也不能略去其作用。例如,某一商品的銷售量既與人口的增長變化有關,也與商品價格變化有關,這時采用一元回歸分析預測法進行預測是難以奏效的,需要采用多元回歸分析預測法。

多元回歸分析預測法,是指通過對兩個或兩個以上的自變量與一個因變量的相關分析,建立預測模型進行預測的方法。當自變量與因變量之間存在線性關係時,稱為多元線性回歸分析。多元線性回歸預測模型的一般公式為:^yi=a+b1x1+b2x2+…+bnxn多元線性回歸模型中最簡單的是隻有兩個自變量(n=2)的二元線性回歸模型,其一般形式為:^yi=a+b1x1+b2x2^式中:yi———因變量x1,x2———兩個不同的自變量,即與因變量有緊密聯係的影響因素a,b1,b2———線性回歸方程的參數a,b1,b2是通過解下列的方程組來得到的。

∑y=na+b1∑x1+b2∑x2xaxbx2bxx∑1y=∑1+1∑1+2∑12xaxbxxbx2∑2y=∑2+1∑12+2∑2【例】某地區通過市場調查,發現電冰箱銷售量同居民新結婚戶數相關,還與居民戶均收入水平相關。該地區近年來電冰箱銷售量、新結婚戶數和居民戶均收入水平資料如表93所示。若預計今年年該地區居民新婚戶數為30.2千戶,居民戶均收入62.5千元,試用二元回歸分析預測法預測該地區本年電冰箱需求量。

·211·經濟統計分析表93某地區電冰箱、新婚戶與居民戶均收入電冰箱新結婚居民戶計算欄年份銷售量y戶數x1均收入x2x2x2···(千台)(千戶)(千元)12x1yx2yx1x2第一年2022.028.5484.0812.3440.0570.0627.0第二年2622.534.0506.31156.0585.0884.0765.0第三年3023.138.6533.61490.0693.01158.0891.7第四年3423.440.0547.61600.0795.61360.0936.0第五年4024.042.5576.01806.3960.01700.01020.0第六年4424.546.0600.32116.01078.02024.01127.0第七年4926.050.2676.02520.01274.02459.81305.2第八年5528.554.8812.33003.01567.53014.01561.8合計298194.0334.64736.114503.67393.113169.88233.7將有關數據代入上述方程組中,得:298=8a+194b1+334.6b27393.1=194a+4736.1b1+8233.7b213169.8=334.6a+8233.7b1+14503.6b2解上述聯立方程組,得:a=-20.8387,b1=-0.0002,b2=1.3889^得預測方程為:yi=-20.8387-0.0002x1+1.3887x2二元線性回歸方程的相關係數的計算公式如下,數據計算如表94所示。

^2(yi-yi)γ=1-∑(^)2槡∑yi-yi表94相關係數計算表--年份^-^(-^)22yiyiyiyiyiyiyi-yi(yi-yi)第一年2018.741.261.59-17.25297.56第二年2626.38-0.380.14-11.25126.56第三年3032.77-2.777.67-7.2552.56第四年3434.71-0.710.50-3.2510.56第五年4038.181.823.312.757.56第六年4443.050.950.906.7545.56第七年4948.880.120.0111.75138.06第八年5555.27-0.270.0717.75315.06合計———14.19—993.48·212·學習單元九相關與回歸分析則有:(^)2yi-yi14.19γ=1-∑=1-=0.9928(-)2993.48槡∑yi-yi槡相關係數為0.993,說明自變量x1、x2與因變量y之間具有高度相關關係,可進行預測。

計算估計標準誤差如下(因為,此時有y、x1、x23個參數,故m=3):(^)2(^)2yi-yiyi-yi14.19s=∑=∑==1.6846y槡n-m槡n-3槡8-3sy1.6846=×100%=4.522%y-37.25說明當用上述二元線性回歸方程進行預測時,具有較高的預測精確度。

當今年該地區居民新婚戶數為30.2千戶、居民戶均收入62.5千元時,該地區本年電冰箱的預計需求量為:y^=-20.8387-0.0002×30.2+1.3887×62.5=65.949≈66(千台)即當居民新結婚戶數為30.2千戶,戶均收入為62.5千元時,該地區電冰箱需求量預測值為66千台。

主題學習單元九課後練習題一、單項選擇題1.現象間相關關係的類型有()。

A.函數關係和相關關係B.相關關係和因果關係C.回歸關係和函數關係D.函數關係和因果關係2.相關分析研究的是()。

A.變量間的回歸關係B.變量間的線性關係C.變量間的函數關係D.變量間的依存關係3.定量研究確定現象間相關關係密切程度的主要方法是()。

A.對現象作分析判斷B.繪製散點圖C.計算相關係數D.編製相關表4.相關係數的取值範圍是()。

A.0≤γ≤1B.-1≤γ≤1C.-1≤γ≤0D.γ≥15.通過相關係數的計算,可說明()。

A.變量間線性相關還是非線性相關B.變量間的因果數量關係C.相關關係的性質和密切程度D.變量間的相互依存關係6.相關係數為0.6,兩變量間的相關程度是()。

A.低度相關B.顯著相關C.高度相關D.零相關·213·經濟統計分析7.相關係數為0,表明兩變量()。

A.是嚴格的函數關係B.不存在相關關係C.不存在線性相關關係D.存在曲線相關關係8.相關分析對資料的要求是()。

A.自變量是隨機的,因變量是非隨機的B.自變量是非隨機的,因變量是隨機的C.兩變量均是非隨機的D.兩變量均是隨機的9.當所有的觀察值y都落在回歸直線上,即落在^y=a+bx上,則y與x的相關係數()。

A.γ=0B.γ=1C.|γ|=1D.|γ|≠110.確定回歸方程時,對相關的兩個變量要求()。

A.都是非隨機變量B.都是隨機變量C.隻需自變量是隨機變量D.隻需因變量是隨機變量二、多項選擇題1.經過分析研究,現象間相互聯係的類型有()。

A.相關關係B.回歸關係C.函數關係D.確定型關係E.非確定型關係2.如果X與Y之間的相關係數等於1,則()。

A.實際值與估計值的離差不存在B.Y的所有理論值與它的平均值一致C.X與Y是函數關係D.X與Y中隻有一個是隨機變量E.X與Y是完全的正相關3.下列屬於相關關係的是()。

A.牛奶銷售量與嬰兒出生人數間的關係B.家庭收入與生活費支出間的關係C.企業的產品產量與單位成本間的關係D.仔豬體重與日采食量間的關係E.生產設備工作時間與修理費用間的關係4.直線相關分析的特點有()。

A.兩變量是對等關係B.兩變量隻能算出一個相關係數C.相關係數可正亦可負D.兩變量都是隨機變量E.相關係數的絕對值小於等於15.下列屬於正相關的現象是()。

A.家庭收入越多,其消費支出也越多B.某產品產量隨工人勞動生產率的提高而增加C.流通費用率隨商品銷售額的增加而減少·214·學習單元九相關與回歸分析D.生產單位產品所耗工時隨勞動生產率的提高而減少E.產品產量隨生產用固定資產價值的減少而減少6.在直線回歸分析中,兩個變量()。

A.一個是自變量,一個是因變量B.都是隨機變量C.一個是隨機變量,一個是給定的量D.是線性相關的關係E.是非線性相關的關係7.如果產品的單位成本(元)對產量(百件)的直線回歸方程為Y=76-1.85X,這表示()。

A.產量每增加100件,單位成本平均下降1.85元B.產量每減少100件,單位成本平均下降1.85元C.產量與單位成本按相反方向變動D.產量與單位成本按相同方向變動E.當產量為200件時,單位成本為72.3元8.職工工資(元)與勞動生產率(千元)的回歸方程為Y=50+80X,這意味著()。

A.勞動生產率為1000元時,職工工資為130元B.勞動生產率每增加1000元時,職工工資提高80元C.勞動生產率每增加1000元時,職工工資提高130元D.勞動生產率等於1000元時,職工工資為80元E.當月工資為210元時,勞動生產率為2000元9.如果自變量Y受因素X1、X2的影響,其中X1、X2與Y的相關係數,滿足|γ|≥0.8時,則應建立()。

A.多元回歸模型B.三元回歸模型C.直線回歸模型D.曲線回歸模型E.二元回歸模型10.估計標準誤差是反映()。

A.因變量的估計值B.自變量數列離散程度的標準C.回歸方程代表性的指標D.因變量序列離散程度的指標E.因變量估計值可靠程度的指標三、判斷題1.相關分析研究的是變量間的因果關係。()2.相關關係是不完全確定的隨機關係。()3.相關係數等於零,表明兩變量不存在相關關係。()4.相關分析要求兩變量均為隨機變量。()5.具有明顯因果關係的兩變量一定不是相關關係。()6.相關係數的取值範圍為o≤γ≤1。()7.相關係數僅僅說明兩變量相關的密切程度。()8.回歸分析中自變量為隨機變量。()9.兩相關的變量間,相關係數不唯一。()·215·經濟統計分析10.標準差為有名數,相關係數為無名數。()11.回歸分析中,利用回歸方程,當給出因變量值可推算出自變量的值。()12.回歸分析的基礎不一定是相關分析。()13.當相關係數小於0.3時,也可進行回歸分析和推算。()14.當γ=-0.86時,回歸係數可以是0.86。()15.相關係數與估計標準差間不存在什麼內在聯係。()四、計算分析題1.已知直線方程中:回歸係數為3,兩變量的平均值分別為y-=50,x-=49,試確定其回歸方程?

2.現有下列資料:試驗田號1#2#3#4#5#6#耕作深度(厘米)81012141618平均收獲量(百公斤/畝)4.005.005.226.097.208.00要求:(1)確定耕作深度與平均收獲量間的相關係數;(2)解釋回歸係數的經濟含義;(3)當耕作深度為17厘米時,平均收獲量將達到什麼水平;(4)當平均收獲量為7.6百公斤/畝時,試推算耕作深度。

3.某企業產品產量與單位成本資料如下:月份123456合計產品產量(萬噸)23434521單位成本(元/噸)737271737368426要求:(1)計算單位成本與產量間相關係數;(2)確定單位成本依產量的回歸方程,並說明各係數的經濟含義;(3)計算估計標準誤差,並判斷回歸方程預測精確性。

·216·學習單元十統計綜合分析擬實現的能力目標:N1.1能認知國民經濟核算體係;N1.2能計算國民經濟宏觀經濟指標;N2.1能編製簡單的統計公報。

須掌握的知識內容:Z1.1國民經濟核算體係的基本框架;Z1.2國民經濟主要經濟指標及計算方法。

引導案例GDP大於GNP的影響國內生產總值與國民生產總值之間的主要區別:GDP強調的是創造的增加值,它是“生產”的概念,則強調的是獲得的原始收入。一般來講,各國的國民生產總值GNP與國內生產總值二者相差數額不大,但如果某國在國外有大量投資和大批勞工的話,則該國的國民生產總值往往會大於國內生產總值。如果一個國家或地區在經濟政策上更關注GDP,那就會更注重本國產業的成熟和發展,而不在乎支撐這些產業發展的是國內企業還是國外企業。如果在經濟政策上更關注GNP,則不僅本國產業要發展,而且應當是本國企業支撐了本國產業的發展。於是,前者會更傾心於招商引資,會把招商引資作為經濟工作的重中之重,後者則重視本國企業,包括國有企業和民營企業的發展。以或者作為經濟政策的主要追求目標,在一定的水平下,會導致GDPGNPGDP本國人民的富裕程度不同。如果強調GDP,就會出現諸如四川民工在深圳打工,把留在了深圳,把利潤帶回了四川;在深圳設廠的企業,亦把留在了深圳,把利GDPGDP潤帶回了本國或本地區。如果強調GNP則意味著本國企業公民在國內或國外都實實在在地給自己掙了錢。這一方麵的典型案例是新蘇南模式和溫州模式的比較。據《第一財經日報》2月24日報道,2004年隨著蘇州經濟一路高歌,GDP總量首超深圳,新蘇南模式似乎達到了中國經濟發展樣板的製高點。但這些掩蓋不了新蘇南模式的缺陷,被比喻為“隻長骨頭不長肉”,GDP上去了,政府的財政收入上去了,老百姓的口袋仍是鼓不起來,利潤的大頭被外企拿走,本地人拿的隻是一點打工錢。年蘇州的2004GDP是溫州的兩倍,但蘇州老百姓的人均收入幾乎隻及溫州的一半。看來,更能反映一個國家、一個地區競爭實力的是,而不是。GNPGDP進一步深入探討會發現,推崇GNP蘊涵的是一種內生的增長模式,內生的增長模式的動力源泉來自於民間發展經濟的衝動。例如,有人把浙江民營經濟比喻為老天爺·217·經濟統計分析經濟(自然條件逼出來的)、老祖宗經濟(曆史上有傳統)、老百姓經濟(來自於民間的普遍性),其顯著特點是本地有不少優秀的企業家。而推崇GDP實際上是一種輸入性的增長模式,其動力源泉來自於政府,是地方政府在發展地方經濟,也包括政績杠杆的驅使之下,以優惠的條件大舉招商引資。內源性經濟增長模式較為紮實,輸入型增長模式由於資本的流動性,如果有更好的投資區域,資本就會流走。(資料來源:www.zhidao.zol.com.cn)主題學習單元一國民經濟核算體係認知欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍問題導入在哪兒能查到“中國居民儲蓄率”,該指標如何計算?

答:居民儲蓄率可通過“中國資金流量表”相關數據計算,具體公式如下:居民儲蓄率=住戶部門總儲蓄/住戶部門可支配收入其中,住戶部門總儲蓄=住戶部門可支配收入-住戶部門最終消費。

欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍國民經濟核算,簡稱國民核算,是指一國或地區國民經濟運行過程及結果的係統描述。它通過一係列具有內在聯係的指標體係和科學統一的核算方法,全麵揭示社會再生產的生產、分配、交換和消費的全過程,科學地揭示國民經濟各部門、各地區和國內外經濟往來活動在社會經濟運行體係中地位、作用和相互間的經濟技術聯係,是國家實施宏觀管理與調控的重要依據。

一、建立國民經濟核算體係的意義國民經濟核算體係,是為衡量一個國家(或地區)在一定時期內經濟活動(流量)和經濟成果(存量),所製定的一套統計核算方式和規則。它以整個國民經濟或社會再生產過程為研究對象,並對其進行計算、測定和描述的宏觀經濟信息係統,因而也就成為社會經濟統計核算要研究的中心內容。國民經濟從靜態看,是由一個國家或地區的各行各業有經濟利益關係的單位所組成;從動態看,就是整個社會再生產的生產、分配、交換、消費的全過程。

國民經濟核算體係,可為宏觀經濟決策和國家發展計劃的製定提供科學依據,可對整個國民經濟的運行狀況進行監測,也可為整個宏觀經濟活動分析和進行國與國間的經濟分析提供基礎數據。同時,國民經濟核算體係所反映出來的國民經濟運行狀態,為投資者和債權人有效的投資和資本運營提供信息支持。

二、國民經濟的兩種核算體係世界上曾經存在著兩種不同模式的國民經濟核算體係:一種是“國民經濟核算體係”·218·學習單元十統計綜合分析(簡稱SNA),另一種是“物質產品平衡表體係”(簡稱MPS)。兩大核算體係在核算方法以及核算內容等方麵都存在著差異。自20世紀90年代起,SNA已在世界範圍內逐漸取代了MPS。1993年,聯合國統計委員會又修訂並通過了新的SNA。目前,它已成為普遍適用於世界各國國民核算的國際標準。

(一)物質產品平衡表體係(MPS)物質產品平衡表體係(SystemofMaterialProductsBalances,MPS)起源於前蘇聯。

從20世紀20年代中期開始,在社會化大生產要求下,前蘇聯為適應計劃經濟管理的需要,開始編製國民經濟平衡表,30年代初形成了體係,50年代末基本定型,並逐步推廣到原經互會國家。可以說,MPS是世界上第一個官方核算體係,後成為聯合國的兩大核算體係之一。1990年以後,隨著蘇聯的解體、東歐國家的轉型,同時也由於MPS自身的缺陷,1993年聯合國第27屆統計委員會全體會議決定,今後隻存在一種核算製度即SNA,而MPS作為一種核算製度已成為曆史。這樣,原使用國家開始著手核算製度的改革,向SNA過渡。

(二)國民經濟核算體係(SNA)國民賬戶體係(SystemofNationalAccounts,SNA)起源於西歐,是當今世界上絕大多國家實行的核算製度。其依據為市場經濟下商品的概念,生產範圍不但包括MSP的物質生產,還包括廣泛的非物質生產,幾乎包括了所有的社會生產部門。國民經濟核算體係以賬戶平衡表為主要核算形式,采用複式記賬方式,可以係統、科學地反映國民經濟運行全過程。聯合國統計委員會在1993年召開的第二十七屆會議上,確定在聯合國成員國中推行一種統一的核算體係,即修訂版的SNA核算體係。1993年的SNA文本適應國際經濟發展變化,對核算原則和一些特殊問題作了闡明以減少核算體係的複雜性,同時增進SNA與其他國際統計標準的一致性,從而使SNA更易被各國所接受。

我國自改革開放以來,已逐漸引入了SNA體係的指標。1992年《中國國民經濟核算體係(試行方案)》正式公布,它以SNA為基礎,並保留了MPS的某些優點(如能直觀地反映平衡關係的若幹平衡表被保留了下來)。1996年,我國的新國民經濟核算體係又依SNA1993年版本進一步進行了調整,2002年國家統計局又提出了《中國國民經濟核算體係(2002)》。

(三)國民經濟核算的基本框架國民經濟核算體係由一套邏輯嚴謹、協調一致而完整的宏觀經濟賬戶、資產負債表等組成,它們的基礎是一套符合國際慣例的概念、定義、分類和核算原則,為不同使用者提供一個內容廣泛的核算框架。其基本部分是一套所謂的中心框架,包括一套與一定時期內發生的不同類型經濟活動有聯係、相關聯的流量賬戶係列,以及記錄機構單位與部門在該時期期初、期末持有的資產和負債存量的資產負債表,如圖101所示。

·219·經濟統計分析國內生產總值表烄國內生產總值表國內生產總值表烄烅國內生產總值表烆國內生產總值表供給表烄投入產出表烅使用表烆產品部門×產品部門表基本核算表烅烄實物交易表資金流量表{金融交易表國際收支平衡表國際收支表{國際投資頭寸表期初資產負債表烆資產負債表{期末資產負債表生產賬戶烄收入分配及支出賬戶經濟總體賬戶資本賬戶烄烅金融賬戶中國國民經濟核算體係烅烆資產負債賬戶生產賬戶烄收入分配及支出賬戶國民經濟賬戶烅國內機構賬戶烅資本賬戶金融賬戶烆資產負債賬戶經常賬戶烄資本賬戶烆國外部門賬戶烅金融賬戶烆資產負債賬戶自然資源實物量核算烆附屬表{人口資源與人力資本核算表圖101國民經濟核算體係基本框架1.基本核算表的內容(1)國內生產總值核算。以國內生產總值為核心指標,對國民經濟活動基本經濟總量進行全麵、係統的核算。

(2)投入產出核算。運用投入產出表詳細地反映國民經濟各產品之間、部門之間互相依存的技術經濟聯係。

(3)資金流量核算。以全社會資金運動為對象,核算各部門資金的來源和運用。

(4)國際收支核算。綜合反映國家的國際收支平衡狀況、收支結構和外彙儲備狀況。

(5)資產負債核算。反映一個國家在一定時點上的國民經濟資產和負債總量、結構。

·220·學習單元十統計綜合分析2.機構部門分類和活動部門分類(1)機構部門分類。按其在取得收入和支配收入、籌集資金和運用資金的財務決策權同一性標準進行分類。分類的基本單位是能夠擁有資產、承擔負債,從事經濟活動並與其他單位進行經濟交易的實體。

檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺殣殣統計小辭典三大需求通常我們所說的“三大需求”指的是投資、消費、出口,被稱為國民經濟的“三駕馬車”。統計分析中,主要通過固定資產投資、社會消費品零售總額和自營出口總額三項指標來觀察。

“三大需求”的來源,需要從國內生產總值的核算方法來說明。從支出法角度講,國內生產總值最終滿足於三方麵需求:資本形成總額(包括固定資本形成和存貨)、最終消費支出(包括居民消費和政府消費)和淨出口(“出口-進口”),其主要內容就可以概括為投資、消費、出口。由於目前中國已進入生產結構性過剩時期,需求決定型的發展模式日趨明顯,因此,近年來經濟學界經常使用“三大需求”來分析研究經濟問題和發展趨勢。

殣(資料來源:國家統計局)檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺殣我國的國民經濟核算體係中,將常住經濟單位分為非金融企業部門、金融機構部門、政府部門、住戶部門等四個機構部門。

(2)活動部門分類。按各基層單位活動性質的同類性對掌握生產經營決策權的基層單位進行分類。這種分類存在層次差別,根據分析的需要,可粗可細。

3.國民經濟核算的基本原則(1)計量社會產品的生產性原則和社會性原則生產性原則,是指國民經濟核算應對生產活動的全部有效成果進行計量。

社會性原則,是指作為核算對象的生產成果還必須具有社會性,即不僅是生產者個人所需要的,而且是社會所需要的,是能得到社會承認的成果。

(2)國民經濟核算的平衡原則社會產品的生產、分配和使用三者在總量上應該是恒等或平衡的。這就是所謂的“平衡原則”,國外有的學者將這種關係稱作“三方等價”原理。

三、國民經濟三次產業劃分為對整個國民經濟進行深入細致的研究與分析,在經濟分析中按生產的順序,把產業門類可劃分為三次產業:第一產業,主要是農業,包括種植業、林業、牧業、漁業等。

第二產業,主要是工業和建築業,包括采掘業、製造業、自來水、電力、蒸汽、熱水、煤氣等的生產和供應業以及建築業。

第三產業,除了第一產業和第二產業以外的其他行業。第三產業主要包括交通運輸、·221·經濟統計分析倉儲和郵政業,信息傳輸、計算機服務和軟件業,批發和零售業,住宿和餐飲業,金融業、房地產業,租賃和商務服務業,科學研究、技術服務和地質勘探業,水利、環境和公共設施管理業,居民服務和其他服務業,教育、衛生、社會保障和社會福利業,文化、體育和娛樂業,公共管理和社會組織,國際組織。

國民經濟核算體係關於三次產業的分類,為計算國內生產總值奠定了基礎,也為分析和預測國民經濟產業結構及發展趨勢以及國際間的比較提供了依據。

四、國民經濟行業分類行業分類是一個相對完備的國民經濟分類體係,是最為基本也最為重要的國民經濟分類。我國的國民經濟行業分類標準將國民經濟分為16個門類,即:①農、林、牧、漁業;②采掘業;③製造業;④電力、煤氣及自來水的生產和供應業;⑤建築業;⑥地質勘查業、水利管理業;⑦交通運輸、倉儲及郵電通訊業;⑧批發和零售貿易、餐飲業;⑨金融、保險業;⑩房地產業;瑏瑡社會服務業;瑏瑢衛生、體育和社會福利業;瑏瑣教育、文化藝術及廣播電視業;瑏瑤科學研究和綜合技術服務業;瑏瑥國家機關、政黨機關和社會團體;瑏瑦其他行業。

五、經濟類型分類根據GB/T124022000標準,我國的經濟類型分類與代碼,如表101所示。

表101我國經濟類型分類與代碼表代碼經濟類型名稱說明10內資資金(資本)主要來源於內地的經濟組織全部資產(資金)歸國家所有,並按國家有關規定登記注冊的非公司製的經11國有全資濟組織(不包括有限責任公司中的國有獨資公司和聯營中的國有聯營)和國家機關、政黨機關全部資產(資金)歸集體所有,並按國家有關規定登記注冊的經濟組織(不12集體全資包括有限責任,股份合作和聯營中的集體聯營)以合作製為基礎,由職工共同出資入股,吸收一定比例的社會投資組建;實13股份合作行自主經營,自負盈虧,共同勞動,民主管理,按勞分配與按股分紅相結合的一種集體經濟組織兩個及兩個以上相同或不同經濟類型的經濟組織,按自願、平等、互利的原14聯營則,共同投資組成的非公司型經濟組織根據國家有關規定登記注冊,由兩個以上,五十個以下的股東共同出資,每15有限責任(公司)個股東以其所認繳的出資額對公司承擔有限責任,公司以其全部資產對其債務承擔有限責任的經濟組織,包括國有獨資公司及其他有限責任公司根據國家有關規定登記注冊,其全部注冊資本由等額股份構成並通過發行16股份有限(公司)股票籌集資本,股東以其認購的股份對公司承擔有限責任,公司以其全部資產對其債務承擔責任的經濟組織17私有由自然人投資設立或由自然人控股,以雇傭勞動為基礎的贏利性經濟組織·222·學習單元十統計綜合分析(續表)代碼經濟類型名稱說明19其他內資以上未包括的內資經濟類型資本(資金)部分(達到國家規定比例以上)或全部來源於港、澳、台地區的經20港、澳、台投資濟組織內地和港、澳、台地區投資者與內地經濟組織按照國家有關規定,按合資合同規定21港澳台合資的比例投資設立、分配利潤和分擔風險的經濟組織內地和港、澳、台地區投資者與內地經濟組織按照國家有關規定,按合作合同的約22港澳台合作定進行投資或提供條件設立、分配利潤和分擔風險的經濟組織的經濟類型依照國家有關規定,在內地由港、澳、台地區投資者全額投資設立的經濟23港、澳、台獨資組織港澳台投資根據國家有關規定,經外經貿部依法批準設立,其中港、澳、台地區投資者24股份有限(公司)的股本占公司注冊資本25%以上的股份有限公司29其他港澳台投資以上未包括的港、澳、台地區投資經濟組織30國外投資資本(資金)部分(達到國家規定比例以上)或全部來源於國外的經濟組織國外法人或個人與內地經濟組織依照國家有關規定,按合資合同規定的比31中外合資例投資設立、分配利潤和分擔風險的經濟組織國外法人或個人與內地經濟組織依照國家有關規定,按合作合同的約定進32中外合作行投資或提供條件設立、分配利潤和分擔風險的經濟組織33外資依照國家有關規定,在內地由外國投資者全額投資設立的經濟組織國外投資根據國家有關規定,經外經貿部依法批準設立,其中外資的股本占公司注34股份有限(公司)冊資本25%以上的股份有限公司39其他國外投資以上未包括的國外投資的經濟組織90其他以上未包括的經濟組織說明:(1)由於衛生行業經濟類型較為簡單,僅采用GB/T12402前兩位代碼;(2)衛生行業暫不使用代碼“15”、“23”、“24”、“29”、“33”、“34”、“39”。

六、經濟資產及分類經濟分析意義上的“資產”,是指那些具有經濟價值、能夠為其所有者帶來某種經濟收益的資源或權益。經濟資產具備兩個基本特征:有明確的所有者;具有經濟利用價值。經濟資產分類如圖102所示。

·223·經濟統計分析有形資產:國定資產、庫存、貴重物品烄烄無形資產:主要是無形固定資產,如礦物勘生產性資產烅探權利、計算機軟件、娛樂、文學非金融資產烄烅烆或藝術原創生產與複製權等有形資產:土地、地下資源、非培育的生物資源和水資源非生產性資產烆{無形資產:專利權、契約、商譽等全部經濟資產烅貨幣黃金和特別提款權烄流通貨幣和存款貨款烆金融資產烅股票和其他股權股票以外的證券保險專門準備金烆其他應收或應付賬款圖102經濟資產分類主題學習單元二國民經濟核算的主要指標欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍問題導入政府消費支出下麵包含了什麼子項目?經濟建設費、社會保障等支出算不算政府消費?

答:支出法GDP中的政府消費主要包含科教文衛費、行政管理費、國防費、公共安全、外交等各項支出中的工資福利、商品和服務經常性支出。經濟建設費屬於投資性支出,社會保障支出屬於轉移性支出,這兩類支出都不算政府消費。

欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍在國民經濟核算體係中涉及許多統計指標,常用的統計指標如圖103所示。這裏僅介紹其中最常見,最基本的統計指標。

產品生產指標:部門總出、中間消耗、增加值、國內總產出、國內生產總值、國內生產淨值烄收入分配指標:國民總收入、國民淨收入、可支配總收入、可支配淨收入、國民收入流量烅收入使用指標:總消費、總儲蓄、淨儲蓄投資積累指標:固定資產形成、資本形成、其他非金融投資、金融資產獲得、金融負債發生烆對外經濟指標:國際收支總額、國際收支構成、各種國際收支差額資產指標:固定資產、存貨、其他生產性資產、土地和地下資產、其他非生產性資產、各種烄金融資產存量烅負債指標:各種金融負債財富指標:資產淨值、國民財富烆人口和勞動力指標:人口數、勞動適齡人口數、勞動力資源、就業勞動力、失業勞動力圖103常用國民經濟統計指標·224·學習單元十統計綜合分析一、經濟流量與經濟存量經濟流量,是反映一定時期內所有經濟活動變化的經濟變量,如國民生產總值、人口自然增長率、彙率等。

經濟存量,是反映某一時點上經濟活動變化的經濟變量,如新增加貨幣量,期初、期末固定資產淨值等。

經濟流量與經濟存量的區分,其實質就是時期指標與時點指標的區分。前者是對某一時期之內現象水平的連續觀察和累計的結果,它有時間量綱(指標值大小與時期長短有關);後者則是對某一時點之上的現象水平進行瞬時觀察的結果,它無時間量綱。

檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺殣殣閱讀材料做一件有創意的事對賣新產品的商家來說,最吸引顧客的無非是“新”,如何再在“新”上繼續做文章呢?有一家商場,就是專售新產品的。有些新產品很暢銷,許多顧客搶著購買,沒搶到手的,要求市場再次進貨,可得到的回答竟是:很抱歉,本商場隻售首批,賣完為止,不再進貨。對此,有些顧客很不理解,還向旁人訴說。但從此以後,來這裏的顧客中意就買,決不猶疑。不難看出,這家商場的“割愛”是個絕妙的創意,它能給顧客留下強烈的印象———這裏出售的商品都是最新的;要買最新的商品,就得光顧這家商場。

殣(資料來源:九九文章網)檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺殣檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺二、國內生產總值(GDP)國內生產總值(GrossDomesticProduct,GDP),是指一國(或地區)疆域內,所有常住經濟單位在核算期內所生產和提供的最終貨物和服務的總價值。“常住經濟單位”,是指在本國經濟領土上具有經濟利益中心的機構型單位。一國的所有的常住單位或所有機構部門構成該國的“國民經濟總體”;所有與常住單位發生經濟往來或存在經濟聯係的非常住單位則統稱為“國外”,其地位是與國民經濟總體相對應的。一國(或地區)疆域內,所有常住經濟單位在一定時期內所生產的物質產品和勞務的增加值總和,就是國民產出的生產概念。

作為一個生產概念,GDP涵蓋了所有生產活動的最終成果,綜合地反映了一國國民經濟活動的總量和全貌,是衡量國民經濟發展規模和宏觀經濟效益的基礎指標。GDP的核算有三種方法:生產法、收入法和支出法。

(一)生產法生產法又稱增加值法(Valueaddedapproach),是直接根據國內生產總值的定義來設計的。國內生產總值是最終產品的價值總和,它衡量的是當期內新創造出來的價值,不包括中間消耗的部分,這使得國內生產總值與總產出指標存在明顯的區別。這裏,所謂增加值就是單位或部門在一定時期內新創造的價值。生產法國內生產總值的計算公式為:·225·經濟統計分析國內生產總值=∑各部門增加值=∑(各部門的總產出-各部門的中間消耗)總產出是指核算期內所有常住單位全部生產活動的總成果,它既包括貨物生產部門的全部產出,也包括服務部門的全部產出;中間消耗是指生產過程中消耗或轉換的貨物與服務價值。計入中間消耗必須具備:一是與總產出相對應的生產過程中所消耗的貨物與服務;二是本期消耗的不屬於固定資本的非耐用品。

因此,國民經濟核算中的國內生產總值(GDP)指標,就是國民經濟各行業的增加值之和。由於一國(或地區)的所有常住單位構成國民經濟各部門,因此,其所有的非常住單位便構成國外部門。

(二)收入法收入法又稱分配法,是從初次分配或收入形成的角度測算國內生產總值的方法,它是通過將所有部門的勞動報酬、生產稅淨額、固定資本折舊和營業盈餘加總來計算的。其計算公式為:國內生產總值=雇員報酬+固定資本折舊+生產稅淨額+營業盈餘雇員報酬,是指勞動者從事生產活動所獲得的全部報酬。固定資本折舊,是為補償生產過程中所耗費的固定資本而按規定折舊率計算的實際折舊額。生產稅淨額,是指生產稅減生產補貼後的差額。其中,生產稅是政府對生產單位生產、銷售和從事經營活動以及因從事生產活動而使用某些生產要素如固定資本、土地、勞動力所征收的各種稅、附加費和規費;生產補貼是政府向生產單位的單方麵無償轉移,可看作一種負的生產稅,如政策性虧損補貼、價格補貼等。營業盈餘,是指從總產出中扣除中間消耗、固定資本折舊、雇員報酬和生產稅淨額後的剩餘部分。

(三)支出法支出法又稱最終使用法,是從使用環節對國內生產總值進行的統計。它是按購買者價格計算的貨物和服務的最終使用價值之和(包括進口價值),扣除貨物和服務的進口價值。其計算公式為:國內生產總值=最終消費+資本形成總額+貨物和服務淨出口從理論上說,上述三種方法因采用統一的記錄時間和計價原則,核算結果應該一致,即遵循國民經濟核算理論中的“三方等價”原則。但由於計算的角度不同,資料來源也不相同,計算結果可能會有誤差。因此,一般各國根據具體情況選用某種方法為主,在支出法核算過程中設立統計誤差項,以保證與其他兩種方法計算結果的一致性。

國內生產總值的計算,一般通過編製國內生產總值及其使用表來進行,如表102所示。

表102國內生產總值及其使用表單位:億元生產數值使用數值一、總產出一、總支出二、中間投入二、中間使用1.物質產品投入1.物質生產部門使用·226·學習單元十統計綜合分析(續表)生產數值使用數值2.服務投入2.非物質生產部門使用三、國內生產總值三、國內生產總值1.固定資本折舊1.最終消費2.雇員報酬(1)居民消費3.生產稅淨額(2)政府消費4.營業盈餘2.資本形成總額(1)固定資本形成總額(2)存貨增加3.出口4.進口(-)5.統計誤差國內生產總值及其使用表,將生產法、收入法和支出法三種方法計算的GDP集中在一張表上,係統地反映了一國的生產投入、產出、分配、消費、資本形成、進出口等社會再生產的總量,能反映出國民經濟中的一些重大比例關係。在這張表中,存在著三個平衡關係:總產出=總支出中間投入=中間使用國內生產總值生產額=國內生產總值使用額國內生產總值指標的優點在於:覆蓋了國民經濟各行各業;避免了中間消耗的重複計算,能確切地反映社會生產活動最終成果的價值量;能完整地反映社會最終產品的實物內容;具有國際可比性。但其也具有一些缺陷,主要是:計算生產成果時,未將本應由企業承擔卻讓外部承擔的成本加以抵扣;該指標隻反映生產成果,不能全麵反映經濟效益、生產效率和實際的生活福利。

三、國內生產淨值(NDP)國內生產淨值(netdomesticproduct,NDP),是指常住單位的增加值之和。增加值是由總產出減去中間消耗計算,但中間消耗並不包括固定資本的消耗,即固定資本折舊,也即國內生產總值包含了固定資本折舊部分。從這意義上說,GDP是總增加值,要分析真實的增加值,應從GDP中扣除固定資產折舊。用公式表示為:國內生產淨值=國內生產總值-固定資本折舊四、國民總收入(GNI)國民總收入(GrossNationalIncome,GNI),是一個收入概念,它是反映常住單位全部收入(來自國內與國外)的指標,是一定時期內本國的生產要素所有者占有的最終產品·227·經濟統計分析(貨物與服務)的總價值。其計算公式為:國民總收入=國內生產總值+來自國外的淨要素收入=國內生產總值+(生產、進口稅-生產、進口補貼)(來自國外淨額)+雇員報酬(來自國外淨額)+財產收入(來自國外淨額)五、國民淨收入(NNI)國民淨收入(netnationalincome,NNI)等於國民總收入減去固定資本消耗後的餘額,相當於過去的國民生產淨值(netnationalproduct,NNP)。其計算公式為:國民淨收入=國民總收入-固定資產消耗六、國內生產總值增長率國內生產總值增長率,是衡量一國或地區經濟增長的重要指標。通常分別用同一標準下的不變價格,計算出各年的GDP數值,然後比較得到GDP的發展速度和增長速度。

其計算公式為:現價計算的國內生產總值不變價格的國內生產總值=國內生產總值價格緊縮指數當年可比價格的國內生產總值國內生產總值增長率=-1上年國內生產總值其中,國內生產總值價格緊縮指數為:名義國內生產總值國內生產總值價格緊縮指數=實際國內生產總值學習單元十課後練習題一、單項選擇題1.SNA體係主要應用了()。

A.計劃指標編製理論B.統計核算原理C.會計上的複式記賬原理D.物質產品平衡原理2.我國習慣上所稱的工業指()。

A.采掘業B.製造業C.電力、煤氣及水的生產和供應業D.A、B、C三者的統稱3.微觀經濟的核算主體,是指()。

A.消費者與生產者B.生產者與政府C.企業與家庭D.消費者與政府4.在宏觀經濟所追求的平衡中,以可持續增長為目標的總供求平衡,對應於()。

A.勞動市場B.產品市場C.金融市場D.國際市場5.國民產出是()。

A.可定量計算B.經常使用定性概念·228·學習單元十統計綜合分析C.與國民總收入是同一詞D.與國民生產總值是同一詞6.在核算範圍上,MPS與SNA相比較()。

A.MPS小於SNAB.MPS與SNA相同C.MPS大於SNAD.無顯著差別7.收入法GDP的計算公式為()。

A.國內生產總值=總產出-中間投入B.國內生產總值=總產出+中間投入C.國內生產總值=總消費+總投資+出口-進口D.國內生產總值=固定資產折舊+勞動者報酬+生產稅淨額+營業盈餘8.社會再生產核算表的五個基本表的中心是()。

A.投入產出表B.國民生產總值及使用表C.資金流量表D.資產負債表9.在核算方法上MPS主要采用()。

A.賬戶法B.複式記賬法C.平衡表法D.平衡表和複式記賬法10.SNA的核算範圍()。

A.限於物質產品的核算B.限於非物質性產品的核算C.限於服務產品的核算D.覆蓋整個國民經濟各部門二、多項選擇題1.MPS體係的主要缺陷表現在()。

A.重物質輕服務,不核算非物質生產部門的服務性生產B.重實體經濟核算,輕資金流動的核算C.缺少經濟存量與經濟流量的銜接D.難以進行國際間的橫向比較分析E.適應於市場經濟下商品的核算2.我國國民經濟核算體係包括()。

A.社會再生產賬戶體係B.經濟核算表體係C.社會再生產核算表體係D.經濟循環體係E.經濟循環賬戶體係3.社會再生產核算表包括()。

A.國內生產總值及使用表B.投入產出表C.資金流量表D.國際收支平衡表E.資產負債表4.經濟循環賬戶包括()。

A.國民經濟賬戶B.機構部門賬戶C.產業部門賬戶D.經常賬戶與資本賬戶E.經濟循環矩陣5.宏觀經濟要處理好的動態平衡主要有()。

·229·經濟統計分析A.勞動力平衡B.產品平衡C.財政平衡D.貨幣平衡E.國際收支平衡6.國內生產總值的核算方法有()。

A.生產法B.收入法C.支出法D.投入法E.產出法7.國民經濟核算體係的作用主要包括()。

A.為宏觀決策和製定國民經濟發展計劃提供科學依據B.對國民經濟運行進行監測C.為宏觀經濟分析提供基礎數據D.用於國際間的經濟比較E.豐富和發展馬克思的政治經濟學8.我國社會再生產核算表的基本表包括()。

A.國內生產總值及其使用表B.投入產出表C.資金流量表D.國際收支平衡表E.資產負債表9.我國經濟循環賬戶,按其核算的內容包括()。

A.經常賬戶B.部門賬戶C.積累賬戶D.資產負債賬戶E.國外賬戶10.在社會再生產核算表補充表中,屬於表現社會再生產條件的核算表有()。

A.人口平衡表B.自然資源表C.勞動力平衡表D.財政信貸資金平衡表E.主要商品資源與使用平衡表·230·正態分析概率表附錄正態分析概率表tF(t)tF(t)tF(t)tF(t)0.000.00000.330.25860.660.49070.990.67780.010.00800.340.26610.670.49711.000.68270.020.01600.350.27370.680.50351.010.68750.030.02390.360.28120.690.50981.020.69230.040.03190.370.28860.700.51611.030.69700.050.03990.380.29610.710.52231.040.70170.060.04780.390.30350.720.52851.050.70630.070.05580.400.31080.730.53461.060.71090.080.06380.410.31820.740.54071.070.71540.090.07170.420.32550.750.54671.080.71990.100.07970.430.33280.760.55271.090.72430.110.08760.440.34010.770.55871.100.72870.120.09550.450.34730.780.56461.110.73300.130.10340.460.35450.790.57051.120.73730.140.11130.470.36160.800.57631.130.74150.150.11920.480.36880.810.58211.140.74570.160.12710.490.37590.820.58781.150.74990.170.13500.500.38290.830.59351.160.75400.180.14280.510.38990.840.59911.170.75800.190.15070.520.39670.850.60471.180.76200.200.15850.530.40390.860.61021.190.76600.210.16630.540.41080.870.61571.200.76990.220.17410.550.41770.880.62111.210.77370.230.18190.560.42450.890.62651.220.77750.240.18970.570.43130.900.63191.230.78130.250.19740.580.43810.910.63721.240.78500.260.20510.590.44480.920.64241.250.78870.270.21280.600.45150.930.64761.260.79230.280.22050.610.45810.940.65281.270.79590.290.22820.620.46470.950.65791.280.79950.300.23580.630.47130.960.66291.290.80300.310.24340.640.47780.970.66801.300.8064·231·經濟統計分析(續表)tF(t)tF(t)tF(t)tF(t)0.320.25100.650.48430.980.67291.310.80981.320.81321.650.90111.980.95232.620.99121.330.81651.660.90311.990.95342.640.99171.340.81981.670.90512.000.95452.660.99221.350.82301.680.90702.020.95662.680.99261.360.82621.690.90902.040.95872.700.99311.370.82931.700.91092.060.96062.720.99351.380.83241.710.91272.080.96252.740.99391.390.83551.720.91462.100.96432.760.99421.400.83801.730.91642.120.96602.780.99461.410.84151.740.91812.140.96762.800.99491.420.84441.750.91992.160.96922.820.99521.430.84731.760.92162.180.97072.840.99551.440.85011.770.92332.200.97222.860.99581.450.85291.780.92492.220.97362.880.99601.460.85571.790.92652.240.97492.900.99621.470.85841.800.92812.260.97622.920.99651.480.86111.810.92972.280.97742.940.99671.490.86381.820.93122.300.97862.960.99691.500.86641.830.93282.320.97972.980.99711.510.86901.840.93422.340.98073.000.99731.520.87151.850.93572.360.98173.200.99861.530.87401.860.93712.380.98273.400.99931.540.87641.870.93852.400.98363.600.999681.550.87891.880.93992.420.98453.800.999861.560.88121.890.94122.440.98534.000.999941.570.88361.900.94262.460.98614.500.9999931.580.88591.910.94392.480.98695.000.9999991.590.88821.920.94512.500.98761.600.89041.930.94642.520.98831.610.89261.940.94762.540.98891.620.89481.950.94882.560.98951.630.89691.960.95002.580.99011.640.89901.970.95122.600.9907·232·主要參考資料[1]吳可傑.統計學原理[M]南京:南京大學出版社,1988[2]汪宗堅.統計學基礎[M]北京:中國商業出版社,1994[3]黃良文.統計學原理[M]北京:中國統計出版社,2000[4]陳仁恩.統計學原理習題解答問題辨析[M]北京:中國統計出版社,2002[5]栗方忠.統計學原理[M]大連:東北財經大學出版社,2008[6]劉登輝.統計學原理[M]蘭州:蘭州大學出版社,2003[7]梁前德.基礎統計[M]北京:高等教育出版社,2000[8]劉純霞.統計學原理[M]北京:中國商業出版社,2012[9]姚壽福,劉澤仁.統計學原理[M]北京:電子工業出版社,2011[10]賈俊平,何曉群,金通進.統計學[M]北京:中國人民大學出版社,2000[11]俞海蓮,劉雪峰.統計學原理[M]北京:中國輕工業出版社,2011[12]程建華,洪文.統計學原理與應用[M]北京:人民郵電出版社,2013·233·