第二節 統 計 分 組
一、統計分組的概念統計分組是根據統計研究的需要,按照一定的標志將總體區分為若干個性質不同而又有聯系的組成部分的一種統計方法。這些組成部分稱為這一統計總體的“組”。
統計分組對總體而言是“分”,即把統計總體劃分為一定意義上的性質相異的若干個組;對個體而言是“合” 即把一定意義上的性質相同的個體組合成一組。其分組原則是,保證組間各單位具有差異性,組內各單位具有同質性。對統計總體進行分組,是由統計總體中各個總體單位所具有的“差異性”特征所決定的,總體的變異性是統計分組的客觀依據。統計分組是把總體劃分為一個個性質
不同的范圍更小的總體。例如,對全國總人口這一總體,根據研究的需要可以按性別等不同的標志進行分組。按照每一個標志分組的結果都把總人口劃分成了兩個組成部分。如表3-1所示。

通過分組,將性質相同的各單位結合在一起,將性質相異的各單位分開,區分了事物之間質的差異,并能據此從數量上揭示事物的內部聯系,從而反映出我國人口的差異與特征,滿足其研究問題的需要。
二、統計分組的作用統計分組是統計整理的主要方法,統計分組的作用主要有以下三方面:
(一)、劃分社會經濟現象的類型。
統計分組的根本作用在于區分現象的質。經濟現象千差萬別,性質各異,任何一批數據都存在著差異,在進行統計分組之前,這種差異處于無序狀態,顯現不出來,通過統計分組,反映出了統計總體的基本性質和特征。分組實際上就是按差異的大小進行分類,差異小的歸人一組,差異大的歸人不同的組。因此,統計分組的結果使組內的差異縮小,而組與組之間的差異擴大。所以說,統計分組的過程就是區別事物性質的過程。要了解各種社會經濟現象的性質、特點及其相互關系,必須按某種標志把它們劃分為性質不同的部分。 例如,國民經濟按行業分組,可以劃分為20個行業門類:
(1)農、林、牧、漁業;<2)采礦業;(3)制造業;(4)電力、燃氣及水的生產和供應業;(5)建筑業;(6)交通、運輸、倉儲及郵政業;(7)信息傳輸、計算機服務和軟件業;(8)批發和零售業;(9)住宿和餐飲業;(10)金融業;(11)房地產業;(12)租賃和商務服務業;(13)科學研究、技術服務和地質勘探業;<14)水利、環境和公共設施管理;(15)居民服務和其他服務業;(16)教育;(17)衛生、社會保障和社會福利業;(18)文化、體育和娛樂業;(19)公共管理和社會組織;(20)國際組織。通過分類,可以反映我國各行業的發展,為進一步研究其水平與結構提供了便利
條件。又如,產業可以劃分為第一產業、第二產業、第三產業;經濟類型可以劃分為國有、集體、民營、合營、個體、外資、中外合資等多種類型;表3-2列示了我國2004年三次產業增加值基本情況。
表3-2 我國2004年三次產業增加值

(二)、反映現象的內部結構
統計往往對總體按某一標志進行分組,并計算總體內各組成部分占全體的比重,以說明各個組成部分在總體中的分布狀況,反映現象的內部結構和結構變化,從而揭示現象的性質和發展變化的規律。
例如,表3-3所列是我國人口就業結構的變化情況,能基本說明我國三次產業人口就業結構的變化,反映了我國產業結構調整的進程。如果將這一結構與其他
國家相比較,還可以顯示我國勞動力的就業特點。
表3-3 我國人口就業結構變化情況 (%)

資料來源:《中國統計摘要》,中國統計出版社,2004
(三)、分析現象之間的依存關系
社會經濟現象不是孤立存在的,各現象之間存在廣泛的聯系和制約關系,一種現象的變化常是另一種現象變化的原因或結果。通過統計分組,可以揭示現象之間的依存關系。例如,施肥量與農作物產量之間、工人勞動生產率和產品成本之間、商品銷售額與流通費用率之間,這些方面的依存關系,都可以利用分組法說明影響因素對結果因素的作用程度。表3-4列示的即為某地區糧食單位面積產量與施肥量的關系。
表3-4 施肥量與農作物產量關系資料單位:公斤/公頃

表3-4中按化肥施用量分組,再計算各組的糧食單位面積產量,可以反映糧食產量與化肥施用量之間的依存關系。隨著化肥施用量的增加,單位面積糧食產量也隨之增加。
統計分組是一切統計研究的基礎,應用于統計工作的全過程,是統計研究的基本方法之一。
三、分組標志的選擇分組標志,即將同質總體區分為不同組的標準或依據。分組標志一旦選定,就必然突出了總體在該標志下的性質差別,而掩蓋了總體在其他標志下的不同。即對同一總體按不同標志進行分組會得到不同的分組結果甚至相反的結論。分組標志選擇不當,不但無法顯示現象的根本特征,甚至會混淆事物的性質,歪曲社會經濟的真實情況。因此,分組標志的選擇是統計分組的核心問題。為了達到統計分組的目的,在進行統計分組時要遵循以下原則:
(一)、根據統計研究的目的選擇分組標志
正確選擇分組標志是統計分組的關鍵。分組標志的選擇是統計分組的核心。分組標志選擇得恰當與否,直接影響到分組的科學性。如要研究總體哪一方面的特征,就應該選擇反映該特征的標志作為分組標志。統計總體中的個體有許多標志,選擇什么標志作為分組標志,要根據統計研究的目的來確定。例如,要了解某單位職工的學歷狀況,就應選擇“文化程度”為分組標志;要了解學生的學習情況,要以“成績”為分組標志,而不能用“性別”、“年齡”、“收入”為分組標志,因為這些內容與要了解的內容無關。
因此,根據研究目的,正確選擇分組標志是保證統計分組具有科學性的關鍵,是保證統計研究獲得正確結論的前提。
(二)、要選擇最能夠反映現象本質的標志作為分組標志。
明確了統計研究的目的,還不等于能夠選擇好分組標志。因為說明同一問題可能有若干個相關標志,在進行分組時,應選擇最能反映事物本質特征的標志。
例如,研究城鎮居民家庭生活水平狀況,而反映居民家庭生活水平的標志有:家庭人口數、就業人口數、每一就業者負擔人數(含本人)、家庭年收人、平均每人年收人等。其中最能反映居民家庭生活水平狀況的標志是“平均每人年收入”,所以應選擇這一標志作為分組標志。
請思考:反映企業規模的標志有許多,如企業職工人數、企業固定資產和生產能力等,請問誰是劃分企業規模大小的最具有本質特征的標志?
(三)、要考慮現象所處的歷史條件和經濟狀況以及標志內涵的變化來選擇分組標志。
社會經濟現象隨著時間、地點、條件的變化而發生變化,其標志的內涵也會發生變化。同一分組,在過去適用,現在就不一定適用;在這一場合適用,在另一場合就不一定適用。
例如,在計劃經濟時期,企業按所有制形式分組一般是分為四組,全民所有制企業、集體所有制企業、私營企業和其他企業。而現在按企業登記注冊類型可分為:(1)國有企業;(2)集體企業;(3)股份合作制企業;(4)聯營企業;(5)有限責任公司;(6)股份有限公司;(7)私營企業;(8)港澳臺商投資企業;(9)外商投資企業;(10)個體企業等類型。又如,對最低生活水平的確定,就不能沿用20世紀五六十年代的標準,而應根據目前的生活水平狀況制定標準,然后再進行分組。此外,行業的劃分,也發生了很大變化。
結合研究對象所處的歷史條件、經濟條件選擇分組標志,這樣可以保證分組標志在不同時間、不同場合的適用性。
請思考:所有的標志都有可能成為分組標志嗎?四、統計分組的方法 分組標志確定之后,還必須在分組標志變異范圍內,劃定各相鄰組間的性質界限和數量界限。根據分組標志的不同特征,統計總體可以按品質標志分組,也可以按數量標志分組。
(一)、按品質標志分組
按品質標志分組是指選擇反映事物屬性差異的品質標志作為分組標志進行分組。按品質標志分組能直接反映事物間質的差別,給人以明確、具體的概念。因為事物的屬性差異是客觀存在的,有些品質標志分組,由于界限清晰,分組標志有幾種具體表現,就分成幾組。例如,人口按性別、民族、職業、文化程度等分組,企業總體按所有制分為國有、集體、聯營、股份合作、其他等組。有些品質標志分組有時也很復雜,其相鄰組之間的界限不容易劃清。有些在理論上容易區分,但在實際社會經濟生活中卻難于辨別。例如,人口按城鄉分組,居民一般分為城市和鄉村兩組,但因目前還存在有些既具備城市形態又具備鄉村形態的地區,分組時就需慎重考慮。其他如部門分類、職業分類也都存在同樣的問題。因此,在實際工作中,為了便利和統一,聯合國及各個國家都制訂有適合一般情況的標準分類目錄,如我國就有《國民經濟行業分類目錄》、《工業部門分類目錄》、《商品目錄》等等。
(二)、按數量標志分組
統計的研究對象是社會經濟現象的數量方面,所以,按數量標志分組是我們研究的重點。按數量標志分組是指選擇反映事物數量差異的數量標志作為分組標志進行分組。如企業按工人數、產值、產量等標志進行分組;居民家庭按子女人數分組,可分為0人(無子女)、1人、2人,3人,等等。按數量標志分組的目的,并不是單純確定各組在數量上的差別,而是要通過數量上的變化來區分各組的不同類型和性質。因此,按數量標志分組,應根據事物內在特點和統計研究的要求,先確定總體在某數量標志的特征下有幾種性質不同的組成部分,再研究確定各組成部分之間的數量界限。例如,人口按年齡分組,男性分為0--6歲、7--17歲、18--59歲、60歲以上;女性分為0-6歲、7--17歲、18--54歲、55歲以上。這是由于國家對男女職工規定退休年齡的不同而有所差別。因此,正確選擇決定事物性質差別的數量界限是按數量標志分組中的一個關鍵問題。現有某校50名教職工2004年月基本工資額(元)資料如下:
417 341 452 338 344 354 266 230 456 258
337 414 375 466 416 504 392 359 440 232
414 466 335 484 310 417 546 283 515 390
380 377 462 371 341 325 292 279 278 304
349 347 410 417 417 292 358 351 330 489
把這些數據按基本工資額分組,如表3-5所示:
五、統計分組的形式
統計分組按分組標志的多少及其排列形式可分為簡單分組、平行分組體系和復合分組體系。在現實經濟生活中,這三種形式都有廣泛的應用價值。
(一)、簡單分組
簡單分組就是對被研究現象總體僅按一個標志所進行的分組。這種分組比較簡單,它只能說明社會經濟現象某一方面的狀況。例如,人口按性別或年齡分組、企業按所有制或規模大小進行分組等。
(二)、分組體系
在統計整理中,為了全面認識被研究現象總體,常常需要運用多個分組標 志對總體進行分組,形成一系列相互聯系、相互補充的分組體系。例如,對國民經濟總體進行統計研究,必須通過按經濟類型、部門、產業、地區、管理系統等多種分組,形成國民經濟分組體系。在我們所要研究現象總體中,總是可以選擇一系列標志進行分組,所以分組體系是客觀存在的,組與組之間層層深人、相互聯系、相互補充。
1.平行分組體系
平行分組體系就是對同一總體同時選擇兩個或兩個以上的標志分別進行簡單分組,然后并列在一起就形成了平行分組體系。例如,為了認識我國工業企業的一些基本情況,可以按所有制、輕重工業、企業規模等分組,得到如下分組體系:

平行分組體系的特點是,每一分組只能固定一個因素對差異的影響,不能固定其他因素對差異的影響。應用平行分組體系,其多種分組相互獨立而不重疊,既可以從不同的角度、不同方面對某一社會經濟現象做出比較全面的說明,反映事物的多種結構,又不至于使分組過于煩瑣,故這種分組被廣泛采用。上面的分組從多方面反映了我國企業類型的狀況,給人以全面的認識。
請思考:如何理解平行分組體系中的“平行”二字?通過上例具體說明“平行”的真正含義。
2.復合分組體系
復合分組體系就是將總體按兩個或兩個以上的標志結合起來進行層疊分組,形成復合分組體系。具體地說,它是先按一個標志分組,再按另一個標志對已經分好的各個組進行再分組。例如,對我校學生先按專業分組,再按性別分組;工業企業先按經營組織形式分組,然后再按規模大小進行分組,見表3-7。

復合分組體系的特點是,第一次分組只固定一個因素對差異的影響,第二次分組同時固定兩個因素對差異的影響,依次類推,當最后一次分組時,則所有的分組標志對差異的影響已全部被固定。復合分組體系可以更深入細致地研究總體的內部結構,反映問題全面深入。但其組數會隨著分組標志的增加而成倍地增加,使各組的單位數減少,次數分布不集中 不易揭示總體的本質特征。因此復合分組體系不宜采用過多的分組標志,也不宜對較小總體進行復合分組。
請思考:1. 如何理解復合分組體系中的“層疊”二字?通過上例具體說明“層疊”的真正含義。2. 自行確定資料,進行如下分組:按一個品質標志的簡單分組、按兩個品質標志的復合分組、按一個品質標志和一個數量標志的復合分組、按兩個數量標志的復合分組。