当前位置:课程学习>>第一章 绪论>>学习内容>>知识点一


知识点一:什么是统计



○ 教师解析

一、统计的含义

统计是统计资料、统计工作和统计科学的总称。有三种含义:

统计资料是反映社会实际情况和变化的数字资料。统计资料即统计信息,是社会经济信息的主体,是国家制订政策、计划和实际科学管理的重要依据。

统计工作是搜集、整理和分析统计资料的实际工作过程,它包括统计设计、统计调查、统计整理和统计分析四个阶段。

统计科学是研究统计工作的理论与方法的一门社会科学。

统计的三种含义有密切的联系。统计资料是统计工作的结果,统计工作和统计资料的关系是工作过程和工作成果的关系。统计科学源于统计工作实践,它一方面是统计工作经验的科学总结和理论概括,另一方面又指导统计工作的进行。统计科学和统计工作的关系是理论和实践的关系。

统计学是一门关于统计资料的收集、整理、描述、显示和分析的科学,其目的是研究和探索数据内在的数量规律性。正是因为统计学总是在和数量打交道,因而我们也可称统计学为“数据的科学”。

二、统计的特征

统计研究具有数量性和总体性两个重要的特征。

统计研究的数量性特征表明统计是从数量方面入手来认识和反映现象的。数字是统计的语言。

总体性是统计研究的另一个重要特点。所谓总体性,是指统计是从总体上反映和分析事物的数量特征,而不是着眼于个别事物。因为事物的本质和发展规律只有从整体上观察,才能做出正确的判断。个别事物由于受种种偶然因素的影响,其数量特征并不能代表整体。因为:第一,只有掌握个别事物的数量特征,才能统计出整体的数量特征,个体的数据是基础;第二,对事物进行分析研究需要联系个别事物的数据和具体情况,才能加深认识,这是辨证唯物主义关于个别和一般辨证关系原理的具体运用。

三、统计学的观念

为了将统计学应用到科学,工业以及社会问题上,我们由研究母体开始。这可能是一个国家的人民,石头中的水晶,或者是某家特定工厂所生产的商品。一个母体甚至可能由许多次同样的观察程序所组成;由这种资料蒐集所组成的母体我们称它叫时间序列。

为了实际的理由,我们选择研究母体的子集代替研究母体的每一笔资料,这个子集称做样本。以某种经验设计实验所蒐集的样本叫做资料。资料是统计分析的对象,并且被用做两种相关的用途:描述和推论。

描述统计学处理有关叙述的问题:资料是否可以被有效的摘要,不论是以数学或是图片表现,以用来代表母体的性质?基础的数学描述包括了平均数和标准差。图像的摘要则包含了许多种的表和图。

推论统计学被用来将资料中的数据模型化,计算它的机率并且做出对于母体的推论。这个推论可能以对/错问题的答案所呈现(假设检定),对于数字特征量的估计(估计),对于未来观察的预测,关联性的预测(相关性),或是将关系模型化(回归)。其他的模型化技术包括变异数分析(ANOVA),时间序列,以及资料采矿。

相关的观念特别值得被拿出来讨论。对于资料集合的统计分析可能显示两个变量(母体中的两种性质)倾向于一起变动,好像它们是相连的一样。举例来说,对于人收入和死亡年龄的研究期刊可能会发现穷人比起富人平均来说倾向拥有较短的生命。这两个变量被称做相关的。但是实际上,我们不能直接推论这两个变量中有因果关系;参见相关性推论因果关系(逻辑谬误)。

如果样本足以代表母体的,那么由样本所做的推论和结论可以被引申到整个母体之上。最大的问题在于决定样本是否足以代表 整个母体。统计学提供了许多方法来估计和修正样本和蒐集资料过程中的随机性(误差),如同上面所提到的透过经验所设计的实验。参见实验设计。

要了解随机性或是机率必须具备基本的数学观念。数理统计(通常又叫做统计理论)是应用数学的分支,它使用机率论来分析并且验证统计的理论基础。

任何统计方法是有效的只有当这个系统或是所讨论的母体满足方法论的基本假设。误用统计学可能会导致描述面或是推论面严重的错误,这个错误可能会影响社会政策,医疗实践以及桥梁或是核能发电计划结构的可靠性。

即使统计学被正确的应用,结果对于不是专家的人来说可能会难以陈述。举例来说,统计资料中显著的改变可能是由样本的随机变量所导致,但是这个显著性可能与大众的直觉相悖。人们需要一些统计的技巧(或怀疑)以面对每天日常生活中透过引用统计数据所获得的资讯。

○ 边学边练

  • 1、统计的涵义从不同方面理解,可以概括为( )【多项选择】。    
       A 统计工作
       B 统计资料
       C 统计科学

了解了统计学的含义,接下来我们进入学以致用。