第二章 统计资料的搜集与整理
第一节 统计调查方案的制定
一、统计调查的意义
1 、统计调查——就是把统计对象作为一个整体,根据统计研究的目的,采用科学的方法,对所要研究的社会现象进行有计划、有秩序地搜集统计资料的工作过程。
2 、统计调查的要求:
( 1 )准确性,
( 2 )及时性,
( 3 )完整性。
二、统计调查方案的制定
一个完善的有指导意义的统计调查方案,必须包括如下的基本内容:
(一)确定统计调查目的
(二)确定调查对象和调查单位
1 、调查对象——是指要调查的那些社会经济现象的总体,它是由性质相同的许多调查单位所组成的集合体。
2 、调查单位——就是调查对象的总体所有组成的个别单位,即标志的承担者。
3 、填报单位——是负责报告调查资料的单位。
一般情况,总体单位就应是填报单位。但当总体单位是“物”的时候,填报单位当然就应由所在单位的“人”来承担。明确填报单位,即可知道调查表发给谁,由谁来填报。
(三)拟定调查提纲
(四)设计调查表和调查问卷
(五)规定调查时间
调查时间的规定有两层意思:
1 、规定调查资料所属的时间。
资料的时间性质有两种:
( 1 )时期资料——是起止时间。
( 2 )时点资料——是标准时点。
2 、调查工作的期限。
(六)制定调查工作的组织实施计划
三、统计调查的种类
(一)统计调查按包括的范围不同,可分为:
1 、全面调查
2 、 非全面调查
(二) 统计调查按调查登记的时间是否连续,可分为:
1 、经常性调查
2 、 一次性调查
(三)统计调查按组织方式不同,可分为:
1 、 统计报表
2 、专门调查
具体方式有:
( 1 )普查
( 2 )抽样调查
( 3 )重点调查
( 4 )典型调查
(四)统计调查按搜集资料的方法不同,可分为:
1 、访问法
2 、登记法
3 、报告法(或通讯法)
第二节 统计调查的组织方式
一、统计报表
(一)统计报表的意义
统计报表——是我国搜集资料的一种重要组织形式。它是按照国家有关规定,自上而下地统一布置、自下而上地逐级提供基本统计资料的一种统计调查组织形式。
(二)统计报表的特点
(三)定期全面统计报表的种类
1. 按照统计报表内容的实施范围,有:
( 1 )国家统计报表
( 2 )部门统计报表
( 3 )地方统计报表
2. 按照统计报表填报周期,有
( 1 )定期报表
( 2 )年报
3. 按照统计报表填报单位区分,有
( 1 )基层报表
( 2 )综合报表
二、普查
(一)普查的意义
普查——是专门组织的一次性全面调查,用来调查属于一定时点上的社会经济现象总量。
(二)普查的组织方式
调查的组织方式有两种:
1 、组织专门的普查机构进行调查;
2 、利用调查单位的现有资料进行的调查。
(三)普查的组织原则
1 、准时点原则
标准时点——普查为了取得一定时点上的总量资料,统一规定的资料所属的时间即为标准时点。例如,我国第五次全国人口普查的标准时点,规定为 2000 年 11 月 1 日 零时。
2 、短期完成原则
3 、项目统一原则
4 、周期调查原则
三、抽样调查
(一)抽样调查的意义
抽样调查——是严格按照随机原则,从现象总体中抽选一部分单位作为样本进行调查,然后依据所取得的样本数据,对调查总体的数量特征作出具有一定可靠程度的推算和估计。
抽样调查具有与其它调查相别的特点:
第一,遵循随机原则;
第二,抽样调查通过样本资料推断与估计总体的数量特征;
第三,抽样误差可以事先计算和进行控制;
(二)抽样调查的组织形式
1.纯随机抽样——又称简单随机抽样。它是按随机原则,直接从总体N个单位中抽选 n 个单位组成样本,保证总体的N个单位,在抽选时都有可能被抽中的机会。
2.机械抽样——又称系统随机抽样或等距抽样。这是将总体单位,按某一标志排队,然后,按固定顺序和一定间隔,抽取调查单位构筑抽样总体(即样本)。
3.分类抽样——又称分层抽样或类型抽样。它是先将总体按主要标志分组,然后 , 在各组中按随机抽样原则抽选一定单位组成样本。
4.整群抽样——它是将总体单位分为若干群后,然后以“群”为单位,从中抽取若干群,对抽中的群的全部单位进行调查。
四、重点调查
重点调查——就是在被研究现象总体的所有组成单位中,选择出其中的重点单位进行调查的方法。
重点单位——是客观存在的,它们在总体的全部单位中,虽然只是少数,但在研究的总体的总量里,却占有绝大的比重,能够反映现象总体的基本情况。
选择重点单位的原则是:单位数尽可能少一些;所包含的标志值尽可能多一些。
五、典型调查
典型调查——是非全面调查,是从调查对象中选择出具有代表性的调查单位,将其作为典型单位开展调查的一种方法。
典型单位有以下三种类型:
1 、代表事物发展先进水平的单位;
2 、代表事物后进水平的单位;
3 、代表新生事物的单位,如:各类改革试点。
第三节 统计分组
一、统计分组的意义
(一)统计分组的概念
统计分组——根据现象总体内在特点和统计研究的要求,按照一个或几个重要标志,把总体单位划分为不同性质的若干组成部分的一种统计方法。
统计分组同时具有两个方面的含义:
1 、对总体而言是分,即将总体划分为性质相异的若干部分;
2 、对个体而言是合,即将性质相同的许多单位组合为一组。
(二)统计分组的作用
1 、区分事物的类型。 2 、揭示现象内部结构。 3 、探讨现象之间的依存关系。
二、分组标志的选择
分组标志——就是分组时作为划分各组界限的标准或根据。由于总体单位的标志有品质标志和数量标志两种,因此,分组标志也有品质标志和数量标志两种:
1 、按品质标志分组。即按对象的属性特征和空间特征来分组。有两种情况:
( 1 )简单的品质标志分组
( 2 )复杂的品质标志分组
2、按数量标志分组。即根据总体单位标志值大小来分组。其表现形式有:
( 1 )单项式分组数列
( 2 )组距式分组数列:
A 、等距式
B 、异距式
选择分组标志的原则:根据研究目的,选择最能反映总体性质特征的、具有现实意义的标志作为分组标志。
三、分组体系
统计分组体系——就是根据统计分析的要求,通过对同一总体进行多种不同分组而形成的一种相互联系、相互补充,能从多方面反映总体内部分布特征的一种认识体系。
(一)简单分组和平行分组体系
简单分组——是指对被研究的现象总体只按一个标志进行分组。
平行分组体系——是指对同一总体选择两个或两个以上标志进行简单分组,就形成了平行分组体系。
(二)复合分组和复合分组体系
复合分组——对同一总体选择两个或两个以上标志层叠运用的分组就是复合分组。复合分组的方法是:先按主要标志第一次分组,然后按次要标志将第一次分组进行各自第二次分组,依此类推,便形成了复合分组体系。
第四节 次数分布
一、次数分配的意义
次数分配——统计资料进行分组之后,将总体的所有单位按组归类排列,形成了总体中各单位在各组间的分布,即称为次数分配或分配数列。
次数——在分配数列中,分布在各组的总体单位数称为“次数”,它表明某种标志在总体各组中出现的多少。如果次数以绝对数的形式出现,称其为“频数”,以 f 表示;
频率——若次数以结构相对数的形式出现,则称其为“频率”,以 f/ Σ f 表示,频率表明各组单位在总体单位中所占比重。
二、次数分配的种类
根据分组标志的不同,分配数列可以分为品质数列和变量数列两种。
(一)品质数列 ——按品质标志分组编制的分配数列,它由分组的名称和次数两个因素组成。
(二)变量数列——按数量标志分组编制的分配数列,用以反映不同变量值各组次数的分布情况。它由变量值和各组次数两部分组成。各组次数的多少,反映了各组变量值在总体中作用的大小。
三、变量数列的编制
(一)组距
组距——是指组距数列中各组变量值从小到大的距离,即各组标志值变动的区间长度。
(二)组限
组限——组距数列中,各组变量值的极端值称为组限,是组与组之间的分界线。其中,
下限——各组的最小变量值
上限——各组的最大数值
组限的表现形式有:
1 、间断式组限:
闭口式
开口式
2 、连续性组限:
闭口式
开口式
(三)组中值
组中值——组距数列中每一组上限与下限之和的中点称为组中值。
计算公式为:
开口式组限,其组中值计算公式为:
组距数列的编制,一般有以下几个步骤:
1 、先将各变量值按顺序排列。
2 、计算全距R。全距又称极差,是数列两端最大变量值和最小变量值的差数。
R = 最大变量值 — 最小变量值
3 、初步确定组数。确定组数的经验公式
K = 1+3.322lgN
其中 N 表示总体单位数
4 、计算组距。组数的多少与组距的大小要由全距来确定,设组数为 k ,组距为 i ,则:
计算出的i若含有小数,为方便起见,将其调整为整数。
5 、根据调整后的组距,再修正组数 K '。
其中 i' 为调整后的组距。
6 、确定组限与组中值。
计算组中值的假设条件是,各单位的标志值在组内分布是均匀的。
四、次数分配的特征
(一)累计次数表
有两种计算方法:
( 1 )向上累计。它是将各组次数和比率,由变量值低的组向变量值高的组逐组累计。
( 2 )向下累计。它是将各组次数和比率,由变量值高的组向变量值低的组逐组累计。
将频数、频率依次累计,可反映截止到某一组的次数总数,简便地概括总体各单位的分布特征。
(二)次数分布的主要类型
1.正态分布——又称钟型分布。这种分布的特征是“中间大,两头小”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少。如图 3-1 所示。
2.U型分布——这种分布的特征是:靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,形成“两头大,中间小”的分布特征。人口按年龄分组的死亡率、机器产品按使用时间分组的失效率,其分布图均呈这种图形,见图 3 — 2 。
图中曲线表明婴幼儿和老年人死亡率较高,中青年死亡率较低,或者是机器刚投入使用时失效率较高,随后急剧下降,保持相当一段时间后失效率又急剧增高的事实。这种分布的曲线,中 间部分占据了整个曲线的绝大部分。
3.J型分布—— J 型分布的特征是“一边小,一边大”,即大部分变量值集中在某一端分布,它有正J型曲线和反J型曲线两种。前者表明次数随变量值的增大而增多,加投资额随利润率大小分布的情况;后者表明次数随变量值的增大而减少,如商品的销售量和其价格的增减变动关系。如图 3 — 3 所示。
第五节 统计图表
一、统计表的意义
统计表——从广义说,任何反映统计资料的表格,都是统计表。从狭义看,是专指统计整理的工具和整理结果的重要表现形式的表格。
统计表的作用可归纳为:
1.概念清晰,系统表现总体的数量特征
2.方便对照比较,优于文字的叙述;
3、检查核对资料便当;
4.可以对现象和事物深入分析。
二、统计表的结构
(一)统计表的形式结构
从形式考察,统计表由总标题、横行标题、纵栏标题和指标数值等要素组成。
总标题——是统计表的名称,它表明了全部统计资料的内容,一般写在表的上端中央位置。
横行标题——是横行的名称,在表中列示各组的名称,它代表统计表所要说明的对象,通常写在表的左方。横行标题也称横标目。
纵栏标题——是纵栏的名称,在统计表中,往往用来表示统计指标的名称,一般写在表的上方。纵栏标题也称纵标目。
指标数值——是说明所研究总体的各种综合指标的,在列表的横行和纵栏的交叉处。统计表中的指标数字,由横行标题和纵栏标题所限定。一般在表的右下方。
(二)统计表的内容结构
从内容考察,统计表由主词和宾词两部分构成。
主词——是统计表所要说明的总体及其各个组成部分,通常在表的左方,即横行标题的位置上。
宾词——是指用来说明总体数量特征的各个统计指标,通常在表的上方,即纵栏标题的位置上。主词和宾词是统计表的两个组成内容,缺一不可。
例如:
三、统计表的种类
(一)广义的统计表包括统计工作中的所有表格。
1 、调查阶段:调查表
2 、整理阶段:整理汇总表。
3 、分析阶段:分析分析表 四、统计表的设计
(一)设计统计表的原则
1.根据需要和可能设计统计表。
2.统计表的总标题需能准确反映表的内容和时间、空间界限。
3.表式的行列比例,要注意美观和实用,即表格的长度和宽度应当保持适当的比例。
4 .表的上下两端线,以粗线或双线绘制,表的左右两端不划线,是开口表式。
5.表内各栏需编号,主词栏用“甲、乙……”宾词栏用“ 1 、2 ……
(二)制表时应注意的问题
1 、填表字迹工整、清晰;数字书写整齐,位数对准;计量单位一致,符合规定。
2 、表中有相同数字,均应填写,不能用“同上”之类代替;没有数字的空格填“ 0' ',不详的格填“……”。
3 、写明对表中数字的特殊说明。
4 、制表人和负责人需签章,并注明制表上报日期。
五、常见的统计图
以下表为例
商品销售额(单位:万元)
商 品 销 售 额 (单位:万元) |
|
一季度 |
二季度 |
三季度 |
三季度 |
家世界超市 |
96 |
83 |
91 |
102 |
华联超市 |
84 |
65 |
75 |
79 |
百盛超市 |
69 |
56 |
70 |
72 |
合计 |
249 |
204 |
236 |
253 |
常见的统计图有以下几种 :
|