須掌握的知識點Z1.1統計整理的中心工作是彙總;Z1.2統計整理的步驟;Z2.1彙總前審核的要點和方法;Z2.2彙總後審核的要點和方法;Z3.1統計分組的含義與意義;Z3.2分組標誌選擇的依據;Z3.3編製變量數列的步驟;Z3.4組距與組數選擇;Z3.5統計表賓詞指標設計;Z4.1統計表設計要點;Z4.2EXCEL圖表製作技術。
引導案例巴恩斯展覽的售票方案幾年前,巴恩斯展覽在世界各地的主要城市進行了巡回展出,吸引了成千上萬的人去觀看。艾伯特·巴恩斯(AlbertBarnes)博士是一位富有的藝術收藏家,他收集的印象派大師的傑作逾800幅。巴恩斯博士1951年去世時曾在遺囑中聲明,他的收藏不允許展出。然而,由於位於費城附近的展館的衰落,法官裁定,為了籌集足夠的資金去修繕展館,這些作品可以巡回展出。考慮到這些收藏品的規模和價值,在每一個城市都會有很多人去參觀。因為空間有限,幾乎所有的美術館都必須同一時間售票(就像一場戲劇),·39·經濟統計分析這樣就可以控製任何一次參觀的人數。為了判斷任何時候可以容納的人數,有必要了解人們願意花費在觀看展覽上的時間的長短;時間越長,說明可容納的觀眾越少;時間越短,將允許售出更多門票。主辦這次展覽的美術館經理意識到,她的場館可以一次安全地容納約250人。盡管有參觀需求的人數在一天裏會有所變動,並且在工作日和周末也可能有所不同,但是她認為任何時候這個需求量都不會低於500人。為了有助於決定售票的數量,她在另一個城市抽取了一個樣本容量為400的樣本,並獲得了這400人觀看展覽所用的時間。通過統計計算並繪製的這個直方圖告訴我們,大約70%的觀展者等候時間小於等於60分鍾,其他的人都在等候不到120分鍾時離開了。盡管還有其他的方案,但展覽的總監建議用下麵的方案:每小時允許進200個參觀者。我們預計大約140人在1個小時內離開,大約60人還會參觀到下一個小時。在下一個小時內,又會有200名參觀者可以進來。如果前麵一個小時的60人還允許進入的話,總共將有260人在展館中。如果這種模式在這一天中保持下去的話,在任何時間最。,。多將有260人這個方案必須保證盡量多的人看到展覽並且能保持舒適和安全(資料來源:凱勒·沃拉克.統計學:在經濟和管理中的應用(第6版).北京:中國人民大學出版社,2006)主題學習單元一統計整理概述欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍問題導入某學生班級某學期某門課程考試成績如下:666988848675737268788210058815479767576716091657672768589926457838151774260706051請用適當的統計表展示該班學生該門課考試成績的分布情況?
欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍一、統計整理的任務(一)統計整理的概念統計整理,是根據統計研究的目的,將統計調查所取得的各項原始資料,進行科學的分類彙總,使之係統化、條理化,得出能反映現象總體特征的綜合資料的工作過程。
準確、及時、完整地搜集原始資料(包括次級資料),是統計調查的基本要求。做好統計整理工作,則是提供準確、及時、完整統計資料的重要條件。有時,為了特定的研究目的,對已整理過的統計資料(即次級資料)進行再加工,以滿足統計分析的要求,也屬於統計整理的工作範圍。
(二)統計整理的任務·40·學習單元三統計整理統計整理在整個統計研究中具有承前啟後的作用,它是統計調查的繼續,又是統計分析的前提。統計整理之所以重要,是因為統計資料整理結果能否如實地反映客觀情況,決定著統計資料的科學價值,也直接影響到統計分析的準確性和真實性。同時,統計整理還是積累曆史資料的必要手段。因為,積累資料時,要對已有的統計資料進行挑選、再加工,這些都要依賴於統計整理。
一般而言,統計資料整理的任務主要在於:一是把統計調查所搜集來的大量反映總體單位個體的、分散零碎的、不係統的、反映事物表麵現象和外部聯係的原始資料,按科學的統計方法進行加工整理,使之成為能反映社會經濟現象總體全貌及數量特征的統計資料;二是對已初步整理過的資料(即次級資料),當然也包括曆史資料,也應根據統計分析和研究的需要進行整理,以便在新的情況下表現現象總體的數量特征。
二、統計整理的內容與程序統計資料整理的主要內容,是審核統計資料和統計彙總。一般情況下,統計資料整理的內容與程序如下:(1)設計與編製統計資料整理方案;(2)對原始資料進行審核與訂正;(3)對經審核的資料進行分組、彙總,計算各組的單位數和合計數,算出各組的指標與綜合指標;(4)對整理好的資料再進一步審核,改正在彙總過程中發生的差錯;(5)用統計圖表的形式,表述彙總的結果。
通常把一套空白的整理表和填表說明及各種統一的分類目錄,稱為整理方案。這裏,正確編製統計資料整理方案,是保證統計整理有計劃、有組織進行的依據。一般情況下,統計整理方案是在製定調查表的同時,根據統計研究的任務和要求,密切聯係調查表的內容而設計的一整套整理表,也就是統計報表製度中的綜合表式,具體指明資料的統計分組標誌與指標體係、彙總資料的組織形式與彙總技術、指標計算方法以及填表說明(如填表範圍、程序、負責機關)等。
在整個統計資料的整理過程中,審核是統計整理的前提,統計分組是統計整理的基礎,統計彙總是統計整理的中心內容,統計圖表是統計整理的有效表現形式,各環節緊密相聯、缺一不可,共同構成統計整理的內容。
三、統計資料的審核統計資料的審核,就是仔細推敲和核定調查資料是否真實可靠和合乎要求。統計資料的審核,包括彙總前審核和彙總後審核。
(一)彙總前審核彙總前審核,一般主要是進行統計資料的準確性、及時性、完整性三個方麵的審核。
統計資料的準確性是審核的重點。對資料準確性審核,包括邏輯檢查,即審核資料的內容是否合理、有無相互矛盾或不符合實際的地方;計算檢查,即通過計算複核整理表中的各項數字有無差錯、各項指標的計算方法是否恰當、計量單位是否正確、有關指標間平·41·經濟統計分析衡關係是否得到保持等。
統計資料的及時性審核,是要檢查資料是否符合規定的時間、資料的報送是否及時,以及未及時報送的原因等。
統計資料的完整性審核,是要檢查報送單位是否有不報、漏報的現象,被調查單位提供的資料是否齊全等。
對於通過審核發現的問題和錯誤,應及時查詢和糾正,以保證統計資料的準確性。
(二)彙總後審核彙總後審核,主要是檢查彙總工作的質量水平。一般要進行每個指標數值的複核計算,即複計審核;不同統計表上重複出現的同一指標數值是否一致,即表表審核;對某些統計、業務、會計三種核算都進行計算的指標數值,進行對照檢查,以便從中發現可能出現的差錯,即對照審核;將彙總得到的指標數值,與調查了解到的實際情況進行比較分析,以驗證資料的真實性,即表實審核。同樣,對彙總後審核發現的差錯,也要及時更正。
四、統計資料的彙總技術統計資料經審核無誤後便要開始彙總。一般有手工彙總和計算機彙總兩種技術。
(一)手工彙總手工彙總雖比較落後,卻使用方便。實際工作中常用的有點線法、憑證法、過錄法、折疊法、卡片法等。但由於手工彙總速度慢、易出差錯,現已逐步被電子計算機彙總技術所替代。
(二)電子計算機彙總電子計算機彙總不僅具有計算容量大、速度快、準確度高等特點,而且可進行邏輯運算和信息存儲,現已被越來越廣泛地應用。其彙總過程,大致可分為五個步驟:(1)編寫程序。即根據統計資料彙總方案,編製包括統計分組、彙總、編製表格等程序設計。
(2)編寫代碼。即根據編製計算機程序的規定,把漢字信息數字化。
(3)數據錄入。即把經過編碼後的數據和實際數字通過錄入設備記載到存儲介質上(如軟磁盤、磁帶、紙帶、穿孔卡片等),以備計算機調用。
(4)邏輯檢查。即按照事先規定的一套邏輯檢查規則,對輸入計算機的原始數據進行分析、比較、篩選和整理,對允許誤差範圍內的個別錯誤由計算機按編輯規則自行更正,對允許誤差範圍外的數據退回審改。
(5)製表打印。當所有數據經過邏輯檢查之後,由計算機按事先規定的彙總表式和彙總層次進行統計製表,並通過打印機等設備輸出。
(三)次級資料的彙總當我們要研究事物的發展趨勢或規律時,需要應用曆史資料或有關的現成資料,也即應用次級資料。在應用這些資料時,就需要認真地對這些次級資料加以甄別和加工。從統計角度來講,對次級資料的彙總整理主要有以下幾種方法:(1)調整法。當次級資料的總體所包括的範圍、指標所包括的範圍以及計算方法、計算價格、計量單位和時間長度等不符合分析要求時,一般可以用加進、減出、換算等方法進·42·學習單元三統計整理行調整。
(2)推算法。當統計分析中所需的某些資料有缺口而無法從實際資料中直接收集補充時,可依據已占有的其他資料通過比例推算、速度推算、內插外推等方法進行估計推算。
(3)再分組。當次級資料的分組方法不科學、不能據以進行正確的統計分析時,可以利用比例分配等方法將次級資料進行再分組,以滿足統計分析的要求。
五、統計彙總的組織形式(一)逐級彙總逐級彙總是按統計整理方案的統一要求,在一定的管理係統中,自下而上地將統計資料進行彙總,並逐級上報。我國定期統計報表一般都是逐級彙總。這種組織形式的優點是:統計資料在滿足上級需要的同時,也能滿足地方各部門的需要,而且便於就地審核和訂正原始資料。其缺點是:彙總的中間環節多,耗費時間長,發生差錯的可能性較大。
(二)集中彙總集中彙總是把所有的原始資料,集中到組織調查的最高機關或它指定的若幹機關同時進行彙總。這種組織形式的優點是:可以省去中間環節,大大縮短整理彙總的時間,便於按整理方案的要求統一部署,有利於計算機彙總技術的采用。其缺點是:彙總工作量大,對原始資料的審核與訂正難度較大。這種彙總形式,對時效性要求較高的快速普查和對彙總要求較高的一些重要的調查,如海關進行的進出口貿易統計,比較適合。
(三)綜合彙總綜合彙總是把逐級彙總和集中彙總結合起來所構成的一種彙總形式。如把各地區需要的資料進行逐級彙總;對全國的總數據和其他一些需要在全國範圍內加工的資料,則集中到國家統計部門彙總。這種彙總形式既可滿足各級、各地對統計資料的需要,又有利於節省時間。
主題學習單元二統計分組欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍問題導入要研究某城市第三產業情況,應如何設計統計表的欄目?
欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍一、統計分組概述統計分組,就是根據統計研究的目的和任務,按照某一標誌將統計總體劃分為若幹個組成部分的一種統計研究方法。統計分組對總體而言是“分”,即將總體內性質不同的單位區分開來,體現組與組之間的差異性;統計分組對總體單位而言是“合”,即將總體內性質相同的單位歸並為一組,確保組內各單位在某一方麵的同質性。例如,在工業企業這個總體中根據企業的生產規模將工業企業劃分為大型企業、中型企業、小型企業3個大類、·43·經濟統計分析16個中類,部分中類下又設若幹個小類。每一類各企業的生產規模相近,類與類之間企業的生產規模差異較大。由此可見,統計分組實質上是在統計總體內部進行的一種定性分類。
(一)統計分組的目的與意義統計分組的目的,就是要將同質總體中有差異的單位區分開來,同時又將性質相同的某些單位組合在一起,以便通過相應的統計指標對總體中所有單位在質量上、數量上、空間上存在的差異進行分析,進一步認識事物的本質特征及其發展變化的規律性。
統計分組的意義在於:統計分組是對總體認識的深化,它通過對總體各單位進行分組來豐富發展對總體的認識;統計分組是在統計總體內部進行的一種定性分類,是確定社會經濟現象的同質總體及研究現象的各種類型特征的基礎;統計分組不僅是統計整理的基礎,也是使認識深化的重要手段,是統計研究的基本方法之一。
(二)統計分組的作用1.可以劃分社會經濟現象的類型在統計分組時,要確保組內各單位在某方麵的同質性,同時又要體現組與組之間的差異性。把社會經濟現象區分為性質不同的組成部分,以認識事物質的差別,在統計分組中,就是類型分組,它往往又是其他分組的前提和基礎。如我國2013年國內生產總值情況,見表31。
表312013年我國國內生產總值單位:萬億元國內生產總值(GDP)產業比上年增長(%)數值比重(%)第一產業5695710.014.00第二產業24968443.897.80第三產業26220446.098.30合計562205100.007.70資料來源:國家統計局由表31可看出,整個國民經濟平穩較快增長,第三產業增加值占比超過第二產業,顯示出國民經濟發展的良好勢頭。
檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺殣殣知識鏈接我國的三次產業劃分如下:第一產業:農業(包括種植業、林業、牧業和漁業)。
第二產業:工業(包括采掘業,製造業,電力、煤氣、水的生產和供應業)和建築業。
第三產業:除第一、第二產業以外的其他各業。根據我國的實際情況,第三產業殣可分為兩大部分:一是流通部門,二是服務部門。具體可分為四個層次:第一層次:檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺殣檺檺檺檺檺檺檺檺檺檺·44·學習單元三統計整理殣檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺殣檺檺檺檺檺檺檺檺檺檺流通部門(物流業),包括交通運輸、倉儲及郵電通信業,批發和零售貿易、餐飲業;第二層次:為生產和生活服務的部門,包括金融、保險業,地質勘查業、水利管理業,房地產業,社會服務業,農、林、牧、漁服務業,交通運輸輔助業,綜合技術服務業等;第三層次:為提高科學文化水平和居民素質服務的部門,包括教育、文化藝術及廣播電影電視業,衛生、體育和社會福利業,科學研究業等;第四層次:為社會公共需要服務的部門,包括國家機關、政黨機關和社會團體以及軍隊、警察等。
殣(資料來源:國家統計局)檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺檺殣檺檺檺檺檺檺檺檺檺檺2.可以反映社會經濟現象總體的內部結構從數量上反映社會經濟現象總體的內部結構及特征,是統計研究的重要內容。通過統計分組,可計算各組數值在總體中所占比重或各組之間的比例關係,從而反映總體的結構情況,說明現象總體的性質和特點,根據不同時期結構的變動情況,可以說明現象總體發展變化的過程及規律,也就是結構分組。例如,2012年我國按年齡和性別分人口數情況,如表32所示。
表32我國按年齡和性別分人口數(2012年)人口數其中占總人口其中性別比年齡(人)男女比重(%)男女(女=100)總計1124661.00576354.00548307.00100.0051.2548.75105.120~463981.0034694.0029287.005.693.082.60118.465~961309.0033252.0028057.005.452.962.49118.5210~1459845.0032370.0027475.005.322.882.44117.8215~1973914.0038909.0035005.006.573.463.11111.1520~24101742.0052033.0049709.009.054.634.42104.6825~2989936.0045257.0044679.008.004.023.97101.2930~3483586.0042539.0041047.007.433.783.65103.6435~3989054.0045524.0043530.007.924.053.87104.5840~44107532.0054913.0052620.009.564.884.68104.3645~4999312.0050563.0048748.008.834.504.33103.7250~5461916.0031554.0030362.005.512.812.70103.9355~5971403.0036136.0035267.006.353.213.14102.4660~6455427.0027928.0027499.004.932.482.45101.5665~6937579.0018728.0018851.003.341.671.6899.3570~7428225.0013991.0014234.002.511.241.2798.30·45·經濟統計分析(續表)人口數其中占總人口其中性別比年齡(人)男女比重(%)男女(女=100)75~7921250.0010125.0011126.001.890.900.9991.0080~8412147.005428.006719.001.080.480.6080.7985~894780.001859.002921.000.420.170.2663.6490~941439.00484.00955.000.130.040.0850.6395以上283.0066.00217.000.030.010.0230.12注:本表是2012年全國人口變動情況抽樣調查樣本數據,抽樣比為0.831‰。
資料來源:國家統計局從表32中可看出截止到2012年我國各年齡段人口總數及性別分布情況。
3.可以分析社會經濟現象之間的相互依存關係社會經濟現象之間廣泛存在著相互聯係、相互依存的關係。同時,社會經濟現象的數量變化又會受到自然技術因素的影響。因此,利用統計分組,就是要反映社會經濟現象之間的這種聯係和依存關係,即分析分組。在統計研究中,把表現為事物發展變化原因的事項稱為因素標誌,而把表現事物發展結果的標誌稱作結果標誌。一般,分析現象間的依存關係,就是通過大量觀察,用因素標誌對總體單位進行分組,再計算結果標誌的數值,借以說明兩個標誌的聯係程度和方向,具體表明現象之間相互依存關係的程度和方向。例如,某企業商品銷售額與存貨資金占用的依存關係,見表33。
表332009~2013年某企業商品銷售額與存貨資金占用單位:萬元年份商品銷售額存貨資金占用20092501302010315140201142023020125102452013650300通過表33,可以看出企業商品銷售額與存貨資金占用兩個因素間具有一定的依存關係,它反映了隨著企業商品銷售額的增加,企業存貨資金占用也上升,這成為正依存關係。
統計分組分別從類型分組、結構分組和分析分組三個方麵發揮著作用,但這三者不是彼此孤立的,而是相輔相成、相互補充、配合運用的。
二、統計分組的要求和基本原則統計分組的關鍵,在於分組標誌的選擇和各組界限的劃分。因為,能否正確地選擇分·46·學習單元三統計整理組標誌,直接影響到統計分組的科學性和統計整理的準確性,並最終影響到統計分析結果的真實性。任何一個總體單位都有許多標誌,分組標誌選擇不當,分組結果必然不能正確地反映總體的分布特征。任何總體單位的標誌都存在著許多變異,在變異的範圍內各組界限劃分不當,必然會混淆各組間的性質差異和數量界限。因此,要在許多可供選擇的標誌中選取能反映社會經濟現象總體性質特征的標誌,必須遵循窮盡和互斥兩條原則。窮盡原則就是總體中的每一個單位都有組可歸,無一遺漏。互斥原則就是在特定的分組標誌下,總體中的任何一個單位隻能歸屬於某一組,而不能同時歸屬於幾個組。在具體選擇時應遵循以下原則:(一)要根據統計研究的具體任務和目的來選擇分組標誌對同一社會經濟現象總體,由於研究的具體任務和目的不同,應分別采用與研究任務與目的有密切關係的標誌作為分組的標準,才能使統計分組提供符合要求的分組資料。
例如,為了研究某地區各類型企業在地區工業經濟中所處的地位和所發揮的作用,就應按企業在工商登記時所登記的經濟類型作為分組標誌;如果要研究工業企業的生產規模,就應選擇企業資產總額、職工人數、人均固定資產擁有量、生產能力等作為分組標誌;如果要研究工業企業的經濟效益,就應選擇勞動效率、淨值報酬率、資產利潤率等作為分組標誌。
(二)要選擇最能反映事物本質特征的標誌作為分組標誌在社會經濟現象總體的若幹標誌中,有的標誌是能揭示總體本質特征的重要標誌,而有的標誌則是非本質的、無足輕重的標誌。隻有選擇能說明問題本質的重要標誌,才能得出觸及問題實質的分組。例如,對企業規模的劃分有企業職工人數、企業固定資產總額、企業資產總額、企業生產能力等標誌,但隻有企業生產能力最能綜合反映企業各種因素的影響,是劃分企業規模大小的最具有本質特征的重要標誌。
(三)要根據現象所處的曆史條件和經濟條件來選擇分組標誌能夠反映社會經濟現象的重要標誌,具有條件性、地區性和曆史性特征。在一定時間、地點、條件下的重要標誌,在另一時間、地點、條件下就會成為非重要標誌。例如,研究企業的生產規模時,在技術不發達或勞動密集型的生產條件下,就比較適合於選用職工人數作為重要的分組標誌;相反,在技術進步的曆史時期或技術裝備水平較高的情況下,就應選擇固定資產總額作為重要的分組標誌。可見,選擇分組標誌不能千篇一律、一成不變,而應適應社會經濟的發展,考慮被研究現象所處的曆史條件和經濟條件,這樣的分組標誌才有現實意義。但是,在分組標誌的選擇時,也要考慮到統一性,要嚴格執行上級部門的統一規定,自覺維護統計工作的集中統一原則。
三、統計分組的方法在統計研究中,分組標誌一旦選定,就要表現出總體在這一標誌下的性質差異和數量差別。一般來說,根據分組標誌的不同,統計分組的方法有以下幾種:(一)按品質標誌分組按品質標誌分組,是指選擇能反映事物屬性差異的品質標誌作為分組標誌,並在品質標誌的變異範圍內劃定各組界限,將總體劃分為若幹個性質不同的組成部分。例如,人口總體按性別劃分為男、女兩組;人口按性別、民族、職業、文化程度等分組。
·47·經濟統計分析按品質標誌分組比較簡單,對總體的劃分隻分一次,隻要分組標誌選定,各組界限就可明顯劃開,如人口總體按性別的分組。但多數情況下,這類分組比較複雜,涉及的組數較多,主要問題就在於組與組之間的性質界限不易劃分。例如,國民經濟按行業分類、人口按職業劃分等。按品質標誌的複雜分組,稱之為統計分類。在實際工作中,為了便利和統一,聯合國及各個國家都製定有適合一般情況的標準分類目錄,如我國就有《國民經濟行業分類目錄》、《工業部門分類目錄》、《商品目錄》等,以統一全國的分類口徑,便於各部門掌握和使用。
(二)按數量標誌分組按數量標誌分組,就是指選擇能反映事物數量差異的數量標誌作為分組標誌,並在數量標誌值的變異範圍內劃定分組界限,將總體劃分為性質不同的若幹個組成部分。例如,人口按年齡分組,工業企業按主營業務利潤率分組等。按數量標誌分組的結果形成變量數列,並可分為單項式分組(即變量值的個數不多,變動範圍不大)和組距式分組(即變量值較多,變動範圍較大)。
總之,按數量標誌分組,就是要在各組的量的變化中反映各組間質的特征。如,聯合國將恩格爾係數(家庭中食品支出總額占消費支出總額的比重)劃分為:30%以下為極富裕型;30%~40%為富裕型;40%~50%為小康水平型;50%~60%為溫飽型;60%以上為貧困型家庭,從而揭示一個家庭或國家的消費結構與生活貧富程度的相對關係。我國2000~2012年恩格爾係數變化情況如表34所示。
表34我國2000年~2012年恩格爾係數年份城鎮居民家庭(%)農村居民家庭(%)200039.449.1200138.247.7200237.746.2200337.145.6200437.747.2200536.745.5200635.843.0200736.343.1200837.943.7200936.541.0201035.741.1201136.340.4201236.239.3資料來源:國家統計局·48·學習單元三統計整理四、統計分組的形式統計分組按分組標誌的多少及排列形式的不同,可以分為簡單分組、複合分組兩種分組形式。在社會經濟的統計研究中,這兩種形式都有較廣泛的應用。
(一)簡單分組與平行分組體係簡單分組,就是按一個標誌將總體加以分組。簡單分組形成的各個組直接說明總體及總體各部分的組成,它隻能說明總體在某一方麵的差別或分配情況。例如,人口總體隻按性別這個標誌進行的分組;消費資料按滿足社會成員消費需要狀況,分為生存資料、享受資料、發展資料三大類。
如果對同一總體選擇兩個或兩個以上的標誌,分別進行簡單分組而形成的分組體係,稱為平行分組體係。例如,為了深刻認識我國工業企業總體的構成情況,可以分別按經濟類型、行業門類、企業規格進行簡單分組,並形成相互聯係、相互補充的一個平行分組體係。例如:(1)按經濟類型分組,可分為國有企業、國有控股企業、外商投資企業。
(2)按行業門類分組,可分為采掘業、製造業、電力、煤氣及水的生產和供應業。
(3)按企業規模分組,可分為大型企業、中型企業、小型企業。
(二)複合分組與複合分組體係複合分組,是對同一總體選擇兩個或兩個以上有聯係的分組標誌重疊起來進行的分組。例如,工業企業先按經濟類型分組,再按企業規模大小這一標誌將已劃分的各組劃分為大、中、小型三組,結果會形成如下的多層重疊的組別,如圖31所示。
圖31複合分組示例對同一總體按兩個或兩個以上有聯係的分組標誌重疊起來進行複合分組所形成的分組體係,稱為複合分組體係。它可以在多層次上觀察多因素的影響。在進行複合分組時,應根據統計研究的目的和要求,按總體的特征和複雜性,來選擇分組標誌,並要確定各個標誌的主次順序,然後依次進行分組,以達到對社會經濟現象進行比較全麵分析的統計研·49·經濟統計分析究目的。
主題學習單元三分配數列編製欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍問題導入若要研究某城市市民對某款服裝的喜好程度,應如何設計問卷調查表及統計整理表?
欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍欍一、分配數列的概念與種類分配數列,是在統計整理中將總體中所有單位按某個標誌分組後,形成的反映總體單位數在各組分布情況的數列,又稱分布數列或次數分配。分配數列主要用來研究總體各單位的分配情況和分布特征,進而反映總體的結構變化,是進一步研究總體某一標誌的平均水平及變動規律的一種統計分析方法,也是統計整理和統計描述的一種重要形式。
按分組標誌的不同,分配數列可以分為品質標誌分配數列和數量標誌分配數列(又稱變量分配數列)兩大類。
(一)品質標誌分配數列品質標誌分配數列,就是按品質標誌分組形成的次數分配數列,又稱屬性分配數列,簡稱品質數列。它由各組的品質標誌的具體屬性和相應的分配單位數兩個要素構成。例如,某企業職工按性別分組的分布數列,如表35所示。
表35某年某企業職工性別構成按性別分組人數(頻數)(人)比重(頻率)(%)男職工25368.75女職工11531.25合計368100.00編製品質數列,隻要根據統計研究的目的,選擇正確的分組標誌,確定分組標準,則事物的性質差異便可以明確地表現出來,各組的性質界限也較容易劃分。因此,一般而言,品質數列能較準確地反映出各總體單位的分布狀態和分布特征。
(二)數量標誌分配數列數量標誌分配數列,是按數量標誌分組形成的次數分配數列,簡稱變量數列。變量數列不僅可以表明總體中所有單位在各組的分布狀態和特征,同時,又是計算總體某一標誌值(變量值)平均水平的基礎。它是統計資料整理的一種重要形式,也是統計分析的一種工具,在統計分析與研究中有著廣泛的應用。如,某校對某班級某門課程考試成績的分組資料,如表36所示。
·50·學習單元三統計整理表36某校某班級某門課程考試成績考試成績學生人數(人)比重(%)60分以下25.060~70717.570~801127.580~901230.090分以上820.0合計40100.0二、變量數列的編製在變量數列的編製過程中,按對變量是否采用組距分組分為單項式變量數列和組距式變量數列兩種。其中,組距式變量數列按組距是否相等又可分為等距數列和不等距(異距)數列。
(一)單項式變量數列編製單項式變量數列,就是變量數列中每個組隻用一個變量值來表示的變量數列,簡稱單項式數列。
【例】假設某年對某城市20戶居民家庭的人口數進行調查,得出每戶的人口數如下:32542232345323243324上述資料比較分散零亂,不易直接看出其分布的基本特征。而且,是離散型變量,變量值的單位不能分割。同時變量值的個數不多,故可編單項式數列。其編製步驟如下:(1)將原始資料按變量值的大小,由小到大依次排列,即:22222223333333444455(2)按變量值分為若幹組(一個變量值為一組,重複隻選一個)。
(3)設計整理表。整理得出變量值出現的次數,即得出如表37所示的變量數列,它可以比較明顯地反映出該城市居民家庭人口數的分配次數和分布特征。
表37某年某市20戶家庭人口數按每戶人口數分組(人)家庭數(戶)比重(%)2735373544205210合計20100·51·經濟統計分析(二)組距式變量數列編製組距式變量數列,就是以變量值表示的一定範圍為組的變量數列,簡稱組距式數列。
【例】假定某校某學生班級某學年第二學期,某門課程的考試成績如下:666988848675737268788210058815479767576716091657672768589926457838151774260706051因變量值較多,且變動幅度較大,往往要將全部變量值依次劃分為幾個區間,故可編組距式數列。這裏的組距,是指每一組內變量值分布的範圍或稱區間的距離。
組距式數列的編製步驟如下:(1)將原始資料按變量值的大小依次排列,即:425154575860606164656668697071727272737575757676767778798181828384858688899192100(2)計算全距。
全距是數據資料中的最大值與最小值之差,它是確定組數的依據。即:全距=Xmax-Xmin=100-42=58(3)確定組距和組數。
在組距式數列中,在全距一定的情況下,組距與組數成反比關係。在社會經濟統計分析中,當組距太大、組數少時,有可能把不同類現象劃分到一個組內;當組距太小、組數多時,也有可能把同類現象劃分到不同的組內。上述這兩種情形都可能混淆事物間質的差異,不能正確反映社會經濟現象總體的分布特征。
在變量數列中,根據組距是否相等可分為等距數列和異距數列兩類。所謂的等距數列,就是各組組距都相等的變量數列;異距數列,就是各組組距不相等的變量數列。至於在實際工作中,是編製等距數列還是異距數列,要根據社會經濟現象的經濟內容、變量變動情況以及統計研究的目的來確定。一般,當變量值的變動不均勻,分布極度偏斜,或為特殊研究需要的目的時,可采用異距數列;當變量值的變動比較均勻,且現象性質的相對差異是由數量的變化逐漸積累起來的情況下,可采用等距數列。
當編製等距數列時,可以參考斯特吉斯(H.A.Sturges)公式來確定其組距。
全距組距=(其中,N為數據個數)1+3.322lgN本例中:100-42組距==9.171+3.322lg40對等距數列,一般取組距為5或10的整倍數。所以,本例中組距取10。
在編製等距數列時,也可以先對總體內部結構情況進行定性分析來確定組數,然後確·52·學習單元三統計整理定組距。或依據上式和慣例確定組距後,再依據下式確定組數,即:全距組距=組數本例中:全距100-42組數===5.8≈6(組)組距104.確定組限和組中值組限,是在組距式數列中表示各組變量值變動範圍的兩個數,即在組距式數列中決定事物性質的數量界限,也就是組距兩端的數值。每組的起點數值稱為下限,其終點數值稱為上限。因此,所謂組距,也就是每組的上限與下限之差,即:組距=組的上限-組的下限每一組的上限與下限之間的中點數值,稱為組中值,即:組的上限+組的下限組中值=2一般來講,組限的確定應以有利於表現總體分布的規律性為原則,具體如下:(1)最小組下限要能容納最小變量值,最大組上限要包含最大變量值,即整個組限的範圍要能包括所有變量值。
(2)各組上下限的數值,最好是組距的倍數。
(3)當總體單位的變量值出現異常大或異常小時,為避免這些變量值無組可歸或出現空白組,要采用開口組,如60以下,90以上等。
(4)劃分連續型變量組限時,相鄰組限必須重疊,即前一組上限必須是後一組的下限,也就是說每一組的變量值歸集,是以下限為起點、上限為極限(即不包括上限)。
(5)劃分離散型變量組限時,一般情況下相鄰的組限必須要有間斷點,但並不絕對。
5.設計表頭,進行整理彙總現依上述分析,整理出某校某班級學生某門課程考試成績的分配數列,如表38所示。
表38某班某學期某門課程成績分析(一)按成績分組組中值(分)學生人數(人)比重(%)50以下4512.550~6055410.060~7065820.070~80751537.580~9085922.590~1009537.5合計—40100.0注:本例中90~100組中含100分,這是處理成績這類問題的一個特例·53·經濟統計分析由於對考試成績來言,60分以下即為不及格,因此可合並整理為如表39所示統計表。