当前位置:课程学习>>第三章 统计数据的整理>>文本学习>>知识点二
统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。其目的就是把同质总体中的具有不同性质的单位分开,把性质相同的单位合在一起,保持各组内统计资料的一致性和组与组之间资料的差异性,以便进一步运用各种统计方法,研究现象的数量表现和数量关系,从而正确认识事物的本质及其规律性。
统计分组是基本的统计方法之一。在资料整理和统计分析中都要广泛应用分组。分组的好坏直接关系到统计能否整理出正确的中肯的统计资料,关系到统计能否得出正确的结论。从某种意义上说,没有统计分组,就没有科学的统计资料的整理,也就没有科学的统计分析。统计分组决不是一个单纯的技术问题,而是一个具有高度原则性和理论性的问题。
统计分组在统计研究中占有重要地位,其基本作用有以下两个方面:
(一)划分现象的类型
社会经济现象存在着复杂多样的类型,各种不同的类型有着不同的特点以及不同的发展规律。在整理大量统计资料时,有必要运用统计分组法将所研究的现象总体划分为不同的类型组来进行研究。
社会经济现象的类型各异其中最重要的类型是指直接反映社会生产关系的类型,因为它可以直接反映一定社会经济结构的特点。比如我国工业划分为重工业和轻工业两大类;社会产品划分为生产资料和消费资料两大类;农业划分为农、林、牧、渔四大类。
(二)揭示现象内部结构
社会经济现象所包括的大量单位,不但在性质上不尽相同,而且在总体中所占比重也不一样。各组比重数大小不同,说明它们在总体中所处地位不同,对总体分布特征的影响也不同。其中比重数大的部分,决定着总体的性质或结构类型。例如,假设一个国家或地区的工农业总产值中,农业总产值所占比重在百分之八九十,则说明这个国家或地区的经济性质是农业经济。可见,研究总体的结构是十分重要的。
分组标志是统计分组的依据。正确选择分组标志,能使分组作用得以充分发挥,也是使统计研究获得正确结论的前提。正确选择分组标志,必须考虑到以下三点:
(一)根据研究问题的目的来选择
(二)要选择最能反映被研究现象本质特征的标志作为分组标志
(三)要结合现象所处的具体历史条件或经济条件来选择
根据分组标志的特征不同,统计总体可以按品质标志分组,也可以按数量标志分组。
(一)按品质标志分组
按品质标志分组是指反映事物属性差异的品质标志作为分组标志进行分组,并在品质标志的范围内划定各组界限,将总体划分为若干个性质不同的组成部分。例如,研究国民经济总体时,可以通过按经济类型、按隶属关系、按地区等品质标志分组。人口按性别分组、按文化程度分组等也是按照品质标志分组。按所包含的数据类型,品质标志的数据属于定性数据,具体又划分为定类数据和定序数据。定类数据是指只划分为类别的数据,而定序数据指的是不仅划分出类别,而且有顺序。如,前面的性别属于定类数据,而文化程度属于定序数据。
(二)按数量标志分组
按数量标志分组是指选择反映事物数量差异的数量标志作为分组标志进行分类,在数量标志的变异范围内划定各组界限,将总体分为性质不同的若干组成部分。数量标志包含的数据类型就是定量数据。根据总体各单位某一数量标志值的变动特征,可供选择的分组方式有以下两种:
1.单项式分组
单项式分组即按每一具体的变量值分组。如工人按看管设备台数分组,如下表:
表3-1 某工厂工人看管设备台数情况表
按工人看管设备台数分组(台) |
工人数(人) |
1 |
20 |
2 |
40 |
3 |
15 |
4 |
15 |
合 计 |
90 |
单项式分组一般在变量值不多,变量值的变动范围不大的条件下采用,否则当离散型变量变动范围比较大,统计单位数有很多的情况下,若采用单项式分组形式,把每一变量值作为一组,则必然会使得分组组数太多,从而失去统计分组的意义。特别是对于连续变量,由于其变量值无法一一举例,所以更不能采用单项式分组,这种情况采用组距式分组。
2.组距式分组
组距式分组即在变量值的变动范围内,将其划分为几个区间,把变量区间内的所有变量值作为一个组,这种用变量的一定地区代表一个组的分组方法称为组距式分组。如将某地区工业企业按总产值计划完成情况分组,如下表:
表3-2 某地区工业企业总产值计划完成情况
按计划完成程度(百分数) |
企业数(个) |
比重(百分数) |
90以下 |
4 |
7.41 |
90-100 |
8 |
14.29 |
100-110 |
32 |
57.14 |
110以上 |
12 |
21.43 |
合计 |
56 |
100.00 |
组距式分组一般在变量值变动幅度大的条件下采用。
(一)简单分组
简单分组就是对被研究的社会经济现象只按一个标志进行分组。这种分组比较简单,它只说明社会现象某一方面的分配状况或联系。如全部国有及规模以上非国有企业按大中小型分组,如表3-3所示:
表3-3 全部国有及规模以上非国有工业企业按大中小型分组
|
企业单位个数(个) |
工业总产值(亿元) |
全国总计 |
171256 |
95448.98 |
其中:特大型工业企业 |
375 |
15471.89 |
大一型工业企业 |
2594 |
16974.39 |
大二型工业企业 |
5620 |
12369.71 |
中一型工业企业 |
5088 |
5675.49 |
中二型工业企业 |
9310 |
6866.92 |
小型工业企业 |
148296 |
38090.58 |
(二)复合分组
复合分组就是对同一总体按两个或两个以上的标志进行分组。分组表的形式可以是层叠式也可是交叉式。表3-4就是交叉式的分组。
表3-4 交叉式分组
|
总计 |
哲学 |
经济学 |
法学 |
合计 |
7190658 |
5372 |
359888 |
387880 |
本科 |
4243744 |
4975 |
222000 |
213278 |
专科 |
2946914 |
397 |
137888 |
174602 |
(三)分组体系
分组体系就是采用一系列相联系、相互补充的标志对社会经济现象分别进行分组,这些相互联系和相互补充的分组,就构成一个分组体系。应用分组体系,可以从不同角度,不同方面对某一社会经济现象作出比较全面的说明。