当前位置:课程学习>>第十一章 研究资料的整理与分析>>文本学习>>知识点一


第十一章 研究资料的整理与分析



知识点一:教育研究资料的整理

在教育科学研究过程中,通过各种方法收集到的原始资料常常是散乱的,不便于分析研究,因此,研究者要及时地进行加工、整理,使之成为有效、有用的资料。研究资料按其性质可分为文字资料和数据资料两大类。相应地,资料的整理也分为文字资料的整理和数据资料的整理。

一、文字资料的整理

教育科学研究的资料大多是文字性的,包括采用多种方法获得的文献记录、观察记录、访谈记录、调查结果以及实验过程的有关文字记录等。整理文字资料的一般步骤包括:审查、分类和汇编。

(一)审查

审查就是仔细研究和详尽考察所获得的文字资料是否真实可靠和合乎要求。

在收集资料的过程中,研究者的主观因素,诸如个人经验、理解水平、价值取向等,都会影响资料的全面性和目的性。如果不进行认真的审核、辨别,就会出现对资料的理解和分析的偏差,从而影响研究结果的科学性。一般地,在审查过程中,研究者应遵循真实性、准确性和完整性的原则。

在实际的研究中,通过不同方法得来的资料,在进行审核时需要注意的问题也不同。

对于观察得来的资料,审查时要注意四个方面的问题:第一,要检查观察资料是不是严格遵循科学方法的程序而获得的;第二,如果资料是用多种方法收集的,应把通过观察获得的资料和通过其他方法获得的资料进行比较,发现问题,再去核实;第三,当观察是以小组进行时,可将不同观察者所获得的资料进行比较,若有差异,小组可进行讨论和验证;第四,对于较重要的问题,应注意观察时间的长短,一般认为,长时间的观察比短时间的观察更真实可靠。

对于通过调查法获得的资料,审查时要注意两点:第一,资料是否完整,即是否有漏填项目;第二,是否有逻辑错误,如年龄填6岁,文化程度填小学毕业。

对于书面文字资料的审查,应注意:第一,弄清资料的作者及其背景;第二,摘录的文字资料要与原文对照,发现错漏应及时更正。

(二)分类

分类是根据研究资料的性质、内容和特征,将相异的资料区别开来,将相同或相近的资料合为一类的过程。

分类应遵循周延原则和相斥原则。所谓周延原则是指,按照分类标准所分的各类能够包括应进行分类的所有研究资料,即分类完整,不会有遗漏。所谓相斥原则是指,按照分类标准所分的各类之间不会混淆,凡是能够归入某一类的研究资料,只能归入该类,决不能归入其他类,即分类互不相容。

在分类过程中,研究者要注意以下两个问题:

第一,要有明确、正确的分类标准。

分类标准是资料分类时所依据的特征。通常,研究者根据研究目的确定分类标准。如对幼儿数学学习兴趣的研究,就可以按照年龄班、学习成绩、性别等标准进行分类。也可以选择最能反映研究对象本质特征的事物作为分类标准,如研究学生学习负担,可以把学生成作业的时间、作业内容的数量和难度、题目的价值等作为分类标准。

第二,对资料的分类可以从质量和数量两方面综合考虑。

质量分类的标准通常是研究对象的品质或属性。如以学生数学成绩的调查结果为例,研究者可以按照性别、年龄、学校类型等标准进行分类。对非数量化的定性描述资料,通常只采用质量分类。数量分类的标准主要是研究对象的某种可以量化的属性。以学生数学学习的兴趣研究为例,研究者可以将学生的学习态度分为“很喜欢”、“喜欢”、“一般”、“不喜欢”、“很不喜欢”五个等级。若研究资料既需要进行质量分类,还需要数量分类时,质量分类通常应先于数量分类进行。

(三)汇编

汇编就是按照研究的目的和要求,对分类后的资料进行汇总和编辑,使之成为能反映研究对象客观情况的系统、完整的材料。

教育研究文字资料的汇编要注意以下几点:

1.根据研究目的、要求和研究对象的客观情况,确定合理的逻辑结构,汇编后的资料既能反映研究对象的真实情况,又能说明研究所要说明的问题。

2.对分类资料进行初次加工。如,给各种资料加上标题,重要的部分标上各种符号,对各种资料按照一定的逻辑结构编上序号。

3.汇编的资料要做到完整、系统、简明和集中。所有采用的资料都要汇编到一起,大类小类要井井有条,层次分明,能系统、完整地反映研究对象的全貌。还可以用尽可能简短、明了的文字,集中地说明研究对象的客观情况,并注明资料的来源和出处。如有必要,可对资料的价值和作用作一些简短的述评,以供进一步研究之用。

二、数据资料的整理1

数据资料的整理一般包括检查资料、数据分类和汇总登记、编制统计图表等工作。

(一)检查资料

检查资料就是对原始数据进行检查。具体包括两方面工作:首先是检查数据资料的完整性,即根据研究目的,检查原始记录是否有遗漏或重复,以便于及时采取措施,填补缺漏,删除重复。其次是检查数据资料的正确性,即检查收集的数据资料是否真实可靠,发现错误要及时地核实和纠正。

(二)数据分类

数据分类也称为统计分类,即研究者把收集来的数据资料按一定的标准分门别类。教育资料统计分类的标准主要有品质分类和数量分类两种。

1.品质分类

品质分类是研究者按研究对象的质量属性、类别、等级所进行的分类。如按学校类别、学生性别分类,或按学生体质强弱进行优良中差等分类。

2.数量分类

数量分类是以数量的大小为分类的标准,它包括顺序排列法、等级排列法和次数分布法。

顺序排列法,即将各数值从小到大或从大到小排列。通过顺序排列,可以看出数据的分布情况。这里的数据可以是幼儿的测验成绩,也可以是调查问卷中调查对象对问题的回答率,还可以是幼儿课堂中举手回答问题的次数等。

等级排列法,即根据顺序排列划分等级。但与顺序排列不同,它是按数值所含的意义确定的。究竟要以数值大的为第一等级,还是以数值小的为第一等级,这要根据数据所反映的事物本身的意义而定。如果是学习成绩的等级,一般以分数高者为第一等级;如果是完成一项活动所用的时间,则以数值低者为第一等级。

次数分布法,又称次数分配,是指研究对象总体或样本随机变量(数据)大小次序在频率上的排列,它通常以次数分布表的形式出现。

(三)编制统计图表

统计表是以简明的表格形式表达数据资料的一种重要形式。在数据资料的整理过程中,统计表的使用,可以避免文字的冗长叙述;便于比较各项目之间的相互关系;便于总计、平均和其他统计值的计算;便于检查计算错误和项目遗漏。

1.统计表

统计表一般由表号、标题、标目、数字、表注等构成。编制统计表的基本要求如下:①表号位于表的左上方,一般以在文章中出现的先后次序来编排。②标题是表的名称,应写在表上方中央位置。标题用语要简明扼要、准确得体,一看标题就能使人知道该表的内容。③标目,即分类的项目,依据排列的位置可分为横标目和纵标目。左侧标目为横标目,上方标目为纵标目。一般地,如果分类的标准只有一个,写横标目或纵标目都可以。如果分类的标准有两个,且二者没有隶属关系,则横标目和纵标目各写一个。如果两个分类标准有隶属关系,则要放在一个方向(横标目或纵标目)分两行分述。④数字是统计表的语言,又称统计指标。它占据统计表的大部分空间,书写要整齐划一,数字应以个位数(或小数点)为准上下对齐,缺数字的项目要划“—”。表中的数字一般不带单位、%(百分号)等,单位和%一般归在标目中。表中的数字构成了表体。⑤表注是对统计表或者表内的某些内容进行补充说明和解释。数据来源、附记等都可以作为表注的内容,文字可长可短。表注写在表的下面。

统计表的一般格式举例如下:

表11—1某年级学生人数

班级人数

一班

二班

三班

四班

五班

合计

26

20

46

25

21

46

24

24

48

23

22

45

24

23

47

2.统计图

统计图是表达统计资料数量关系的几何图形。它能使事物的数量关系表达得形象、直观、容易理解和记忆。在运用统计图表示统计资料时,常常附以统计表作为参照。

统计图一般由标题、图号、标目、图形、图注等构成。编制统计图的基本要求如下:①标题简洁,能正确反映图形表现的内容;图号写在标题的左前方;标题和图号均位于图的下方。②对于有纵横轴的统计图,要分别在纵横轴上标明统计项目和尺度。横轴一般为基线,表示被观察对象,尺度要等距,自左向右,由小到大,写在横轴的下方。纵轴一般是尺度线,尺度从0开始,由下往上,从小到大,写在纵轴的左侧。两个轴都要注明单位。③图形要突出、清晰和美观,如果在一幅图中有几个图形,则要用一定的方式加以区别。④图注的文字要简明扼要,用小号字写在标题的下方。

常用的统计图有条形图和圆形图。

(1)条形图

条形图,也叫直条图,主要用于表示离散型数据资料,即计数资料。它是以条形的长短表示各事物间数量的大小与数量之间的差异情况。条形图中一个轴是分类轴,表示类别,描述计数数据;另一个轴是数量轴,表示大小多少,描述计量数据,在这个轴上的数据单位的大小取决于原始数据。

如某年级学习成绩等级的直条图:

绘制条形图的注意事项:

①直条的宽窄要适当,条宽一致,各组直条之间留有相同的间隙。

②各直条的高度对应于尺度线上某个数据,不要在直条的顶端或下端注明数字。

③直条的排列顺序可按时间序列,数量多少,以及相比较事物的固有序列,或根据具体情况来定。相比较的数目不宜太多。

(2)圆形图

圆形图,又称饼图,主要用于描述间断性资料,目的是为显示各部分在整体中所占比重的大小(一般用百分比表示),以及各部分之间的比较。

如某年级成绩分布比例的圆形图:

绘制圆形图的基本步骤如下:

①根据各组成部分在总体中的比重(百分比)计算各个扇形的圆心角度数。计算方法是:360×比重(百分比)。

②作一个圆,然后以圆的上方或下方的半径为基线,以顺时针方向将各部分按其特定顺序排列,将圆分成几个扇形。

③对各个扇形用不同的线条或颜色加以区分,并在扇形内注明简要的文字和百分比,或用图例说明各部分的内容。

注释:1

近代统计学之父——凯特勒

凯特勒(Lambert Adolphe Jacques Quetelet,1796-1874),国际统计会议之父、近代统计学之父、数理统计学派创始人

凯特勒出身于比利时甘特市的一个小商人家庭,1819年(23岁)在甘得大学获得博士学位。1823年建议政府建立天文台,为了筹建工作,被派往法国学习。由此,与拉普拉斯、普阿松、傅立叶等人相识,并从拉普拉斯学习概率论。1827游学英国伦敦:1829一1830年先后到德国、法国、瑞士、意大利等国考察。据说,他曾偶然接触到人寿保险公司实际业务问题,促成他从事统计的研究。1823年天文台建成后,被任名为台长,并开始发表人口及犯罪方面的统计研究。l841年成立比利时中央统计委员会,由他任终身主席。凯特勒学识渊博,是统计学家、数学家、天文学家、物理学家。

近代统计学之父

人类的统计实践活动起始于计数,这在原始社会就有了。随着岁月的流逝,人类统计实践活动越来越丰富,发展到17世纪,“统计学”应运而生。统计学的产生最初是与“编制国情报告”有关。作为国家的首脑、治国者、政治家,在经济上必须了解国家的收入与支出、生产的过剩与不足、产品的出口与进口;在军事上必须了解进攻与防御时的兵力;在法律上必须了解社会上犯罪的情况,等等。于是编制有关这方面国情和国力的数据、资料和图表就成了统计学的任务。因此,最早的统计学也称为“国势学”,即它研究的主要是“国家的形势”。17世纪,研究这门学问的人在德国被称为“国势学派”,在英国则被称为“政治算术学派”,前者注重材料的记述、年鉴的编制,后者更注重数量分析方法的运用。但是,这两个学派都有其局限性,一是他们在很大程度上还处于统计核算的初创阶段,只能以简单、粗略的算术方法来对社会、经济等现象进行计量和比较。二是他们只是记述各国的国力、国情,静态地研究社会现象。三是他们对统计结果表述的静态规律常常用“上帝”的意志来解释,而没有把它们看成是社会现象背后固有的一种统计规律性。

自文艺复兴以后,人们已经注意到在各种玩纸牌、掷骰子的赌博活动大量进行之后,会有某种类型的规则性出现。概率论最早就是研究这种规则性的产物。经过17 世纪法国的帕斯卡、瑞士的贝努利,18世纪法国的莫阿弗尔和拉普拉斯、英国的贝叶斯,19世纪德国的高斯等数学家的研究,作为研究随机现象规律性的古典 “概率论”到了19世纪已经形成。拉普拉斯说:“由于现象发生的原因多为我们所不知,或知道了也因为原因繁复而不能计算;发生原因又往往受偶然因素或无一定规律因素所扰乱,以致事物发生发展的变化,只有进行长期的大量观察,才能求得发展的真实规律。概率论则能研究此项发展改变原因所起作用的成分,并可指明成分的多少。”

由于历史的原因,概率论的产生和形成在16至18世纪与统计学关联性不大;统计学也很少将概率论应用到自己的领域。将统计学与概率论真正结合起来的,则是19世纪凯特勒的功绩。故人们称他为“近代统计学之父”。

认定社会现象具有自身的统计规律性

1819年凯特勒大学毕业后,主要从事数学教学工作。1823年为筹建天文台,他被政府派往巴黎学习天文学。在学习期间,凯特勒与拉普拉斯、油松、傅立叶等概率论专家学者相识,从他们那里学到了较高水平的概率理论。同时他还受到法国盛行的力学自然观,特别是拉普拉斯机械唯物论思想方法的影响。1827年他赴伦敦学习,又大量接触了政治算术学派的经济统计学和人口统计学的思想方法。回国后,凯特勒任布鲁塞尔大学教授,讲授天文学、测量学。1828年他编写了《比利时综合统计手册》与《概率计算入门》。1829年他协助制订了荷兰人口调查计划。1829年至1830年期间,他先后到德国、意大利、瑞士等国从事地磁测量研究。在德国他拜见了高斯。在国外期间,他还接触到人寿保险业务上的实际统计问题,增加了对从事统计学研究的兴趣。1831年,比利时从荷兰分离出来后,凯特勒参与主持新建比利时统计总局的工作。在此后的5年中,他开始从事有关人口和犯罪问题的统计学研究。

在这种研究中,凯特勒发现以往被人们认为从个体来说具有偶然性、从整体来说具有杂乱无章性的社会犯罪现象,也具有一定的规律性。他根据英国、法国、俄国等的统计资料,作出了很多统计分析,结果发现如果一连观察几年的犯罪数字,如凶杀案件、行凶方法、犯罪形式、判罪比例等的数目,那么可以看出,这些数字逐年都在同一范围内变动,呈一定的规律性。

此外,凯特勒在作有关人类的自杀统计、人口统计、婚姻统计、神经病患者统计时,均发现与上述雷同的现象。于是,凯特勒确认那些表面上似乎杂乱无章的、偶然性占统治地位的社会现象,如同自然现象一样也具有一定的规律性。他认为统计学不仅要记述各国的国情,研究社会现象的静态,而且要研究社会生活的动态,研究社会现象背后的规律性。凯特勒的这一思想为近代统计学的科学化奠定了基础。他还认为社会现象背后的这种规律性是社会内在固有的,而不是“神定秩序”;人们可以通过计算统计指标来揭示这些规律。凯特勒的这些思想给后世统计学家以深刻的影响。

犯罪统计中所呈现出来的规律性,竟使凯特勒联想到司法机构的经费预算问题。1829年他说:“可预想每年有同一犯罪以同一序列重复出现。监狱和法院的预算,与国家每年收入几乎同样确定。”1835年他在《论人类》一书中又说:“世界上,人们每年按某一惊人的常例来确定用于监狱、徒刑场和断头台等开支的预算。虽然人们想尽力节约这笔开支,但只要仔细考察这些开支数目,却不幸每年都中了我的预言。”对于凯特勒的上述成就,马克思曾给以充分的肯定:“凯特勒先生在1829年发表的对可能出现的罪行的估计,不仅以惊人的准确性预算出了后来1830年法国发生的犯罪行为的总数,而且预算出了罪行的种类。”

凯特勒还从实际出发,不顾当时统治阶级的偏见,提出犯罪与贫穷之间并不存在着必然联系。他根据统计资料得出结论:鉴于最贫穷地区的犯罪数目不及经济发达地区的犯罪数目大,因此,犯罪反而与经济(走向)富裕有关。凯特勒的上述工作,处处闪烁着他社会统计规律性思想的光辉,给后人以极大的启迪。

把统计学与概率论结合起来

A·凯特靳的最大的贡献就是将法国的古典概率引入统计学,用纯数学的方法对社会现象进行研究。

统计学成为近代意义上的科学的统计学,本来是从引进概率论开始的,它的奠基人正是凯特勒。1828年前,他就从拉普拉斯等数学名家那里学到了概率论,并著有《概率计算入门》一书。他深知要在社会现象中发现规律,必须运用概率计算理论。他说:“概率论在我们将要研究的现象中,对于人们从实际或经验上命名的一切东西,将代之以具有科学性的东西。”

从1831年开始,凯特勒搜集了大量关于人体生理测量的数据,如体重、身高与胸围等。经分析研究后,认为这些生理特征都围绕着一个平均值而上下波动,呈现出概率论中所述的正态分布。

他以5738名苏格兰士兵的胸围为例。这种分布规律和在射击时枪弹围着靶子中心分布的规律一样,都是以大数律为主要内容的概率论所揭示的正态分布规律。凯特勒还进一步运用这个规律,检查出自己国家新兵身高频率曲线与理论正态分布曲线不相吻合的不正常情况,推测这可能是征兵工作中出了问题。调查结果发现,果真有几个征兵机关从中作弊。凯特勒上述统计工作实际上是拉普拉斯等人概率论中正态分布曲线、误差法则等理论的运用。

凯特勒运用概率论的方法进一步研究了社会道德中的大量统计资料,发现了以下基本原则:“在我们对于多数人进行观察的时候,人的意志就平均化起来,并且不留任何显著的痕迹。所有部分意志的作用,和纯粹受偶然原因所制约的各种现象一样,它们即被中和或抵消了。”这就是凯特勒著名的“平均人”思想。他认为“不应当注意个别的人,而应当把个别的人当作种族的一部分来考察。只有把人的个性去掉之后,我们才能把存在于人们中间的所有偶然的东西摒弃殆尽。这样,那种对于大量现象仅起极小作用的、或完全不起作用的个别特殊性,就自然会平均化起来,从而我们就能把握住综合的结果”。同时他还认为对社会上偏离“平均人”的差异性,也要研究其发生的原因。据他研究,社会上所有的人同“平均人”的偏差愈小,社会上的矛盾也就愈缓和。而文化上的正面引导,则可以减少每个人与“平均人”的偏差,从而减少犯罪的发生。凯特勒的“平均人”思想在历史上影响很大。马克思在其《资本论》一书中也曾运用过这种思想。

凯特勒就是这样在自己的研究工作中,把统计学与概率论结合起来。他首次在社会科学的范畴内提出了他的大数律思想,并把统计学的理论建立在大数律的基础上,认为一切社会现象也受到大数律的支配。他的这种统计思想曾盛行一时,至今还有影响。

1857年凯特勒在第三次国际统计会议上,论证了概率论方法对于统计价值测定的必要性。1867年他在第六次国际统计会议上,又提出希望能建立一个特别小组委员会来处理直接与概率论有关的统计问题。凯特勒不仅把概率统计的方法引入到人口、领土、政治、农业、工业、商业、道德等社会领域,还把概率统计的方法引入到天文、气象、地理、动物、植物等自然领域。他的这种关于概率统计的方法是应用于任何事物数量研究的最一般方法的思想,对以后统计学的发展具有重大意义。

著作:

《论人及其才能的发展》(再版时改名为《社会物理学》)(1835)

《关于应用于道德科学、政治科学的概率论的书简》(1846)

《社会制度及其支配规律》(1848)

《社会物理学》(1869)