發布時間:2011-10-22 共4頁
第三節 統計學中的幾個基本概念
統計學中的概念很多,為了敘述方便,有利于以后各章學習,本節先集中介紹幾個常用的貫穿于全書的基本概念。
一、統計總體和總體單位
根據一定的目的和要求,統計需要研究有關的統計總體。所謂統計總體,是由客觀存在的、具有某種共同性質又有差別的許多個別單位所構成的整體,當這個整體作為統計研究對象時稱統計總體,簡稱總體。例如,研究某個工業部門的企業生產情況時,該部門的所有工業企業可以作為一個總體,因為它是由許多客觀存在的工業企業組成的,而每個工業企業都是進行工業生產活動的基層單位,具有同質性。
如果一個統計總體中包括的單位數是無限的,稱為無限總體,例如,連續大量生產某種零件時,其總產量是無限的,構成一個無限總體。總體中包括的單位數是有限的,稱為有限總體。例如,在特定時點上的人口總數、工業企業總數等等,都是有限總體。對于有限總體,既可以進行全面調查,也可以抽樣調查。對于無限總體來說,只能進行抽樣調查,根據樣本數據推斷總體特征。此外,統計總體還可以分為靜態總體和動態總體,前者所包含的各個單位屬于同一個時間,后者所包含的各個單位則屬于不同時間。根據一定的目的,針對這兩類總體就可以分別進行靜態研究或動態分析。
綜上所述,可見總體和總體范圍的確定、取決于統計研究的目的要求。而形成統計總體的必要條件,亦即總體必須具備三個特性:大量性、同質性和變異性。
(一)、大量性
大量性是總體的量的規定性,即指總體的形成要有一個相對規模的量,僅僅由個別單位或極少量的單位不足以構成總體。因為個別單位的數量表現可能是各種各樣的,只對少數單位進行觀察,其結果難以反映現象總體的一般特征。統計研究的大量觀察法表明,只有觀察足夠多的量,在對大量現象的綜合匯總過程中,才能消除偶然因素,使大量社會經濟現象的總體呈現出相對穩定的規律和特征,這就要求統計總體必須包含足夠多數的單位。足夠多數,是指足以反映規律的數量要求。當然,大量性也是一個相對的概念,它與統計研究目的、客觀現象的現存規模以及總體各單位之間的差異程度等都有關系。
(二)、同質性
總體的同質性,是指構成總體的各個單位至少有一種性質是共同的,同質性是將總體各單位結合起來構成總體的基礎,也是總體的質的規定性。例如,全國工業企業作為統計總體,則每個總體單位都必須具有從事工業生產活動的企業特征,而不具有這些特征的就不能稱之為工業企業。如果違反同質性,把不同性質的單位結合在一起,對這樣的總體進行統計研究,不僅沒有實際意義,甚至會產生虛假和歪曲的分析結論。
同質性的概念是相對的,它是根據一定的研究目的而確定的,目的不同,同質性的意義也就不同。例如,研究全國工業企業的生產狀況時,所有工業企業都是同質的,而研究民營工業企業生產狀況時,那么,民營工業企業與國有工業企業就是異質的。可見,同質性是相對研究目的而言的,當研究目的確定后,同質性的界限也就確定了。
(三)、變異性
總體各個單位除了具有某種或某些共同的性質以外,在其他方面則各不相同,具有質的差別和量的差別,這種差別稱為變異。正因為變異是普遍存在的,才有必要進行統計研究,是統計的前提條件。總體中各個單位之間具有變異性的特點,這是由于各種因素錯綜復雜作用的結果,所以有必要采用統計方法加以研究、才能表明總體的數量特征。
請思考:要研究某銀行職工的工資情況,其統計總體是什么?想一想這個總體是否同時具備統計總體的三個特征?
構成總體的每一個事物或基本單位稱為總體單位。原始資料最初就是從各個總體單位取得的,所以總體單位是各項統計數字最原始的承擔者。例如,研究某個工業部門的生產情況時,該工業部門的所有工業企業可以作為一個總體,每個工業企業則是總體單位,將每個工業企業的某些數量特征加以登記匯總,就取得該工業部門的統計資料。
總體和總體單位是相對而言的,在一次特定范圍、目的的統計研究中,統計總體與總體單位是不容混淆的,二者的含義是確切的,是包含與被包含的關系。但是隨著統計研究目的及范圍的變化,統計總體和總體單位可以相互轉化。同一事物在不同情況下,可以作為總體,也可以作為總體單位。例如,在上述某一工業部門所有工業企業的統計總體中,每個企業是一個總體單位。但為了要研究一個典型企業的內部問題時,則被選作典型的某一企業又可作為一個總體。
請思考:總體和總體單位可以指單位也可以指人,請問可以指物嗎?舉例說明。
二、標志
每個總體單位都具有許多屬性和特征。例如,就全國工業企業這一總體來說,每個工業企業所屬的經濟類型、行業性質、職工數目、產品產量和產值等的特征,可以說明每個企業的具體情況。這些說明總體單位屬性或特征的名稱,在統計上稱為標志。
標志的屬性或數量在各總體單位的具體表現稱為稱為標志表現。如果說標志是統計所要調查的項目,那么標志表現是調查所得結果,標志的實際體現。 統計研究是從標志表現開始的,標志表現是最基礎的統計資料,是形成指標數值的原材料。每個標志的具體表現就是在標志名稱之后所表明的屬性或數值,例如,當我們研究的總體是全國工業企業時,企業的“行業性質”、“經濟類型”、“工業總產值”是調查標志,企業的“工業”特征就是“行業性質”的標志表現;企業的“國有經濟”、“集體經濟”、“股份制經濟”、“私營經濟”等,就是“經濟類型”的標志表現;企業的工業總產值“4000萬元”、“6000萬元”、“9000萬元”就是“工業總產值”的標志表現。
(一)、品質標志和數量標志
標志按其性質可以分為品質標志和數量標志。品質標志是表明總體單位的質的特征的名稱。例如,工人的性別、民族、文化程度、工種等這一類標志,不能用數量而只能以性質屬性上的差別即文字來表示,稱為品質標志,表示事物的質的特征。
數量標志是表明總體單位的量的特征的名稱。例如,工人的年齡、工齡、工資,工業企業的工人數、產量、產值、固定資產等等,只能以數量的多少來表示,稱為數量標志,表示事物的量的特性。
就一個品質標志或數量標志而言,其具體表現可能多種多樣,不能將標志與標志表現混為一談。例如對三個工人的月工資計算平均數,只能說是對三個標志表現或三個標志值計算平均數,不能說對三個數量標志計算平均數,因為數量標志只有一個,即工人的“月工資”。
(二)、不變標志和可變標志
標志按變異情況可以分為不變標志和可變標志。如上所述,標志在總體單位之間各有一定的具體表現,有的相同,有的則不盡相同。標志如果在總體各單位之間的具體表現完全相同,該標志就稱為不變標志。例如,國有工業企業的經濟類型是屬于國家所有,這個標志對國有工業企業這一總體來說,就是不變標志。任何總體的各個總體單位至少要有一個共同的不變標志,才能使它們結合在一起,這個不變標志就是構成總體同質性的基礎。
總體單位的標志的具體表現,大多數都是在各單位之間變化其性質和數值的。如果某些標志在總體各單位的具體表現不完全相同,這些標志稱為變異標志或可變標志。例如,國有工業企業的產量、產值、工人數等標志,是隨著每個企業的具體情況而變動的,這些標志就是可變標志。
請思考:每一個學生作為總體單位具有哪些標志?指出其中的品質標志和數量標志。
三、統計指標和統計指標體系
根據統計研究的目的和要求,確定了總體、總體單位及其各種標志以后,就應采用一定的統計方法對各單位的標志的具體表現進行登記、核算、匯總和綜合,以說明各個總體的數量特征。這主要是通過統計所特有的指標來實現的。
(一)、統計指標
統計指標是反映統計總體的數量特征的概念和數值。與標志不同,它是依附于統計總體的。例如,人口數目,土地面積、工農業產品產量、工農業總產值、成本、利潤、國民收人等等,這些概念用于反映一定統計總體的數量方面時,就是統計指標。任何統計指標總是要通過一定的數值來加以說明的,這種數值稱為統計指標數值。統計指標數值是現象發展變化的規律性在一定時間、地點和條件下的數量表現。一個完整的統計指標是由兩個部分所構成,即指標名稱和指標數值。指標名稱和指標數值是兩個既有聯系又有區別的概念。指標名稱是統計所研究的社會經濟現象的科學概念,表明社會經濟現象的質的規定,反映某一社會現象內容所屬的范圍;指標數值則是統計所研究現象的具體數量綜合的結果,對某一社會經濟現象總體特征從數量上加以說明。統計指標名稱及其指標數值的有機結合,也就是事物質的規定性和量的規定性有機聯系的表現。
統計指標一般包含有六個要素:即指標名稱、計量單位、核算方法、時間限制、空間限制和指標具體數值。例如,我國2004年國內生產總值為136515億元。該統計指標就包含上述六個要素。
從事統計指標的理論設計主要是制訂和規范前三個要素,而從事具體的統計調查和數據搜集工作,則是要準確核算后三個要素,這也是具體統計工作所要承擔的繁重任務。
統計指標按其所反映的數量特點和內容的不同,可以分為數量指標和質量指標兩類。凡是反映社會經濟現象范圍的廣度、規模大小和數量多少的指標叫數量指標,它表示事物外延量大小。例如人口總數、企業總數、耕地面積、工業總產值和商品流轉額等,都屬于這一類指標。數量指標是用絕對數表示的,并具有實物的或貨幣的計量單位。統計實踐中這類指標通常是以總量指標的形式出現。由于數量指標反映的是現象總體的絕對量,因此其指標數值大小隨總體范圍的大小而增減變動。
反映現象本身質量、現象的強度、經營管理工作質量和經濟效果等的統計指標,稱為質量指標,它表示事物的內涵量狀況。例如產品合格率、固定資產的利用程度、單位成本指標、利潤率、勞動生產率等等。質量指標是用相對數或平均數表示的,統計工作中,這類指標通常是以相對指標或平均指標的形式出現。由子質量指標反映的是現象總體內部的數量關系,因此其指標數值大小與總體范圍大小沒有直接的關系。 數量指標和質量指標的關系表現在,數量指標是計算質量指標的基礎,質量指標往往是相應的數量指標進行對比的結果。
最后還應指出,統計指標與標志之間的區別和聯系。
兩者的區別主要表現在:①反映的對象和范圍大小不同。統計指標說明的是總體的數量特征,而標志則是反映總體單位的數量特征。②表述形式不同。統計指標都可以用數值表示,而標志既有能用數值表示的數量標志,又有不能用數值只能用文字表述的品質標志。
兩者的聯系主要表現為:①具有對應關系。在統計研究中,標志與統計指標名稱往往是同一概念,具有相互對應關系。因此,標志就成為統計指標的核算基礎。②具有匯總關系。許多統計指標的數值是由總體單位的數量標志值匯總而來的。如某地區工業總產值就是各企業總產值加總之和,這里,地區工業總產值就是統計指標,而各企業總產值則是標志。同時,通過對品質標志的標志表現所對應的總體單位數進行加總,也能形成統計指標。例如上述的工業企業經濟類型,匯總后可得出具有某種屬性的總體單位數,如國有經濟企業數、集體經濟企業數等。③具有變換關系。由于統計研究的目的不同,統計總體和總體單位具有相對性。統計總體和總體單位規定的非確定性,導致相伴而生的統計指標和標志也不是嚴格確定的。隨著研究目的的變化,原有的總體轉變為總體單位,相應的統計指標也就成為標志;反之亦然。這說明指標與標志之間存在著一定的聯系和變換關系。
(二)、統計指標體系
社會經濟現象是一個復雜的總體,各類現象之間存在著相互依存和相互影響的關系。一個統計指標往往只能反映復雜現象總體某一方面的特征,要了解客觀現象在各個方面及其發展變化的全過程,僅靠單個的統計指標是不行的,必須建立和運用統計指標體系。
所謂統計指標體系,就是若干個反映統計總體數量特征的相對獨立又相互聯系的統計指標所組成的整體。例如,一個工業企業把產品產量、凈產值、勞動生產率、質量、消耗、成本、銷售收人等統計指標聯系起來就組成了指標體系,這便于我們全面、準確地評價該企業的生產經營情況。
由于現象之間相互聯系的多樣性和人們認識問題的多視角,反映現象總體的統計指標體系也可以從不同的角度進行分類。
指標體系按其反映內容不同,可分為社會統計指標體系、經濟統計指標體系和科學技術統計指標體系。它們分別從人口社會、國民經濟運行和科學技術發展三個方面,反映一定時期、一定范圍內國民經濟和社會科技發展的總體狀況。
指標體系按其考核范圍不同,可分為宏觀指標體系、中觀指標體系和微觀指標體系。宏觀指標體系反映整個社會、經濟和科技情況;中觀指標體系反映各個地區和各個部門、行業的社會、經濟和科技情況;微觀指標體系反映各企、事業單位的生產經營或工作運行情況。
指標體系按其作用功能不同,可分為描述性指標體系、評價性指標體系和預警性指標體系。描述性指標體系主要是反映社會經濟現象的現狀、運行過程和結果;評價性指標體系主要是比較、判斷社會經濟現象的運行過程、結果是否正常;預警性指標體系是對經濟運行過程進行監測、起預警作用的指標。
上述各類統計指標體系都有其自身的特點,實際工作中可以根據統計研究的目的選擇運用或結合運用,以便充分發揮統計的信息、咨詢和監督的整體功能。
請思考:你平時對哪些統計指標體系有過了解?請舉例說明。
四、變量
可變的數量標志稱為變量,各種統計指標也是變量。變量的具體表現,就是可變數量標志或統計指標的不同取值,稱為變量值(亦即標志值)。一個變量可以取多個變量值,二者不能混淆。例如,工資這個變量,可具體表現為840元、780元、900元、680元等多個變量值。
按照變量值的連續性不同,變量可以分為連續變量和離散變量。前者是指它的數值是連續不斷的,即在任意兩個相鄰數值之間可以取無限多個不同的數值。例如,人體的身高、體重等都是連續變量。連續變量的數值是通過測量或計算方法取得的,既可用小數表示,也可用整數表示;離散變量的數值是通過逐個計數的方法得出的,變量值只能以整數斷開,而不能表現為小數的。例如,職工人數、企業數、機 器臺數等都是離散變量,其可能數值的個數是有限的,構成有限總體。
請思考:人的年齡是連續變量還是離散變量?為什么?
變量按其性質可以分為確定性變量和隨機變量。在一個系統中,如果某一變量的值能夠被另一個變量或若干個變量(因素)的值,按一定的規律惟一地確定,則該變量就可以稱之為確定性變量。例如,在銷售價格P為一定的條件下,某商品的銷售額Y的變動完全由銷售量X所確定,Y就成為確定性變量。所謂隨機變量,其數值的變動受到許多種因素的影響,在相同條件下進行觀測,由于影響因素的作用不同,其可能的實現值(或觀測值)不止一個,數值的大小隨機波動,帶有偶然性,事前無法確定。例如,除了某種正常的、起決定性的因素外,影響某企業生產的同一批次燈泡的質量波動還有許多因素,如果抽取一部分燈泡進行檢驗,這種燈泡的壽命值不盡相同,數值的大小帶有偶然性的波動,檢驗前是不能預先確定的,則燈泡壽命就是隨機變量。隨機變量具有隨機性或偶然性,但它的數值變動卻有一定的規律性,通過大量觀察,應用統計技術方法,可以揭示和描述其數量特征以及變動的規律性。