当前位置:课程学习>>第一章 绪论>>学习内容>>知识点四
一、总体、单位和样本
(一)总体
由许多性质相同的个别事物组成的整体,叫统计总体,简称总体。组成总体的性质相同的个别事物,叫总体单位,简称单位,也叫个体。现象个体的同质性,是构成统计总体的必要条件,性质相异的个体是不能组合成总体的。统计上所讲的单位同人们日常生活中所说的单位并不完全相同,它可以是一个人,一家企业,一所学校,一件产品等等。我们说“全国高等学校”是一个总体,那么,全国的每一所高校都是总体的一个总体单位,这时的“单位”同人们日常生活中所说的单位,其意义是相同的。但如果把“全国总人口”作为一个总体,那么,每一个具有中华人民共和国国籍的公民都是其中的总体单位,这时的“单位”同人们平常所说的单位就不一样。因此,我们可以概括出统计总体的如下特征:
1.同质性:即构成总体的各单位必需在某一方面性质相同。
2.大量性:即总体应该由为数众多的单位构成。
3.差异性:即构成总体的各单位除了某一方面或几方面性质相同以外,必须在其他方面存在着差别,这是统计的必要条件。
总体按其包含的单位数目是否可数分为有限总体和无限总体。如果一个总体的单位是可数的,我们称为有限总体,否则是无限总体。社会经济统计所研究的大多是有限总体。
总体还可分为变量总体和属性总体。如果我们研究的是总体各单位的数量方面的特征,这时的总体称为变量总体;如果我们研究的是总体各单位的性质方面的特征,此时的总体可称为属性总体。
总体和单位的这种关系不是永远固定不变的,而是随着研究目的和研究对象的变化而变化的,即总体可能成为单位,单位也可能成为总体。
(二)样本
样本是指按照随机原则从同质总体中抽选出来的那部分单位组成的小的总体,是统计推断的基础。比如,我们按照随机原则从河南50所高校中选出样10所高校进行“大学生普通话使用情况调查”,这10所高校就是一个样本。
二、标志和指标
(一)标志
标志是说明总体单位特征的名称或概念,有数量标志和品质标志之分。说明总体单位数量特征的名称或概念,叫作数量标志;说明总体单位属性特征的名称或概念,叫作品质标志。例如人口总体中的每一个人(单位)都有年龄、性别、身高、体重、民族、受教育程度等方面的特征,这些特征使得某个人同其他人区别开来。这里,年龄、身高、体重等是数量标志,而性别、民族和受教育程度等是品质标志。各种标志都有自己的标志表现,数量标志表现为具体的数值,如在人口研究中某人的年龄30岁、体重56公斤等等,这里的30和56都是标志值;品质标志表现为对特征加以描述的文字,比如民族的“汉”,性别的“男”等等。
(二)指标
1.统计指标的概念。
说明总体特征的概念叫统计指标。一个完整的统计指标应包括指标名称、指标数值、指标计量单位、指标所属的时间和空间范围等要素。例如1996年河南省大中型工业企业工程技术人员38870人,1990年我省向香港地区出口商品30537万美元等,都反映了具体、翔实、丰富的社会经济信息。但人们在理论上使用的统计指标通常只是一个指标名称,如国内生产总值、耕地面积、居民储蓄额、人口密度等。
2.统计指标的类别
统计指标按其表现形式不同分为绝对数指标、相对数指标、平均数指标。绝对数指标反映现象的总规模和总水平,如人口总数、总产出、工资总额、增减量等。相对数指标反映现象之间的对比关系,如发展速度、经济比例等。平均数指标反映现象总体内部各单位的一般水平,也可以反映发展的平均水平和平均速度,如粮食平均亩产量、平均年龄、平均发展速度等。
指标按其反映现象的内容不同可以分为数量指标和质量指标。数量指标反映现象的绝对量的多少,如工业总产值、利税总额等。质量指标反映现象间的数量关系,如各种相对数和平均数等。
指标按其所反映现象范围的大小,分为总体指标和样本指标。总体指标如总体总量、总体平均数、总体成数、总体方差。样本指标反映样本的数量特征,如样本平均数、样本成数、样本标准差等。
指标按其所反映现象的时间状况不同分为静态指标和动态指标。静态指标反映既定时间上现象的规模、水平、数量关系等,如一般平均数、绝对数和许多相对数等。动态指标反映现象在不同时间内发展变化的情况,如序时平均数、发展速度、增长速度等。每一类别的统计指标都有更详细的分类研究,这将在本书的不同章节分别予以阐述。
(三)指标和标志的关系
指标和标志是一对相关的概念,它们有区别也有联系。指标是说明总体数量特征的,标志是说明总体单位特征的,统计指标都表现为具体的量,具体的数值,不论是数量指标还是质量指标。标志说明总体单位的特征,数量标志能用数值表示为一定的量,但品质标志只能用适当的文字来表达。凡和总体对应的都是指标,凡和单位对应的都是标志。但由于总体和单位的关系是相对的,不是绝对的,因此当总体和单位的地位发生了变化的时候,指标和标志的地位也会随之发生相应的变化,即,总体变成单位的时候,原说明总体特征的指标就变成新情况下的说明单位特征的标志了;反之,当单位变化成总体的时候,原说明单位特征的数量标志就成了新情况下的说明总体特征的指标了。
三、变量和变量值
在统计研究中,变量是一个非常重要的概念。一般地说,变量是现象发展变化的数量化概念,或者说是现象本身所固有的、随条件变化而变化的量。我们前面讲过的所有的统计指标和所有的数量标志,都是变量。变量的具体数值表现就是变量值,比如在“1995年河南省电力消费总量为566.48亿千瓦小时”这个指标中,“电力消费量”是变量,“566.48”是变量值。本书使用的变量主要有如下几种:
(一)自变量和因变量
自身变化会引起其他变量变化的量,叫自变量;受其他变量影响而变化的量,叫因变量。比如,单位产品的原材料消耗量的多少影响单位产品成本的高低,因此,单耗是自变量,成本是因变量。这类概念多在相关和回归分析中使用。
(二)确定性变量和随机性变量
受某些确定性因素影响,现象的量会沿着某一方向持续变化,这样的量就是确定性变量,如由于科学技术的不断提高和医疗卫生条件的不断改善,人类的死亡率在逐步降低,人类的平均寿命在不断延长,因此从长期来看,人的平均寿命和死亡率都是确定性变量。有些变量的变动受许多因素变动的影响,变量值的大小没有明确的方向,出现什么样的数值,带有偶然性,这样的变量称为随机性变量。例如按随机原则从总体中选取容量一定的样本,每一次都会得到不同的结果,因此,样本是个随机变量。又如测量同一个螺母的内径(尺寸),不同的人可能得到不同的结果,这个“内径尺寸”就是随机变量,等等。随机变量在抽样理论、数理统计中经常使用。
(三)连续变量和离散变量
这里,变量的连续性或离散性,是以变量值是否可以无限分割为标准的,即,凡是一个变量相邻的两个变量值之间可以继续分割,取得新的变量值,那么,这样的变量称为连续变量,比如道路的长度、耕地面积、人的平均身高、劳动生产率、粮食总产量,等等,都属于连续变量,它们通常需用计算或测量的方法取得变量值。凡一个变量相邻的两个变量值之间不可能再分割出新的变量值,这样的变量称为离散变量,如人数、企业数、产品件数等等。离散变量通常以点数的方法取得变量值。这两种概念多在变量数列分析中使用。