一、数据、变量与常量
什么是数据?教师20年教龄、每一个学生的测试成绩、教师所教学科等都是数据。所谓数据,是带有单位的数,是通过对具体事物进行计数或者测量所得到的描述事物特征的数量依据,从数量关系的角度反映了事物的存在状态。
教育现象是极其复杂的,总是处于变化和发展之中,对其某一特性观察或测量所得到的数据也是随机的、不确定的。学生的学习能力、学校每年支出的教育经费、学校每年的中考录取率、学生的社会经济背景等,像这种标定统计事项某一特性的量,称为变量,总体中此特征值有两个或两个以上。与变量相对应的量称为常量,它在一定范围内其数值不会随意改变,即总体中所有成员都具有相同的值,如农村女童的性教育问题研究,性别就不再是一个变量,而是一个常量。
二、数据的特点
数据具有变异性和规律性两方面的特点。
变异性是指对客观事物观察或测量得到的一组数据,数值总是在一定的范围内不断变化,表现出不同程度上的差异。如100名学生的成绩有高有低,不完全相同;50名教师的教学水平高低不同。
规律性是指数据在一定的范围内呈现出变异的同时又存在着一定的规律,即数据的分布具有规律性。如100名学生成绩虽有高有低,不完全相同,但这种变化在一定范围内表现出一定的规律性,大部分学生的成绩会在某个值左右波动,而成绩优秀或成绩很差的学生较少,表现出一定的规律性。由于数据在变化中具有这种可循的规律性,才为我们探索教育现象的规律提供了可能。
三、数据的分类
教育实验、调查或测验等不同,所获得数据不同,选择的统计分析的方法也不同。不同的分类标准,数据分为不同的类别。
(一)按变量测量水平,可分为称名变量、等级变量、等距变量和比率变量
像身份证号、学生学号等,没有大小意义,只是进行标记的符号。再如用1代表男教师,2代表女教师;1代表语文,2代表英语,3代表数学等。像上述数据用来划分、区别事物的不同种类所形成的变量叫称名变量,又称分类数据。它是指根据事物的某一特征,即属于同一类的事物用一个数字来表示,属于另一类的事物用另外一个数字表示。称名变量只说明某一事物与其他事物在属性上的不同或类别上的差异,不说明事物之间差异的大小,不能进行加、减、乘、除运算。
对学生学习成绩实行等级评定,分别用5、4、3、2、1来表示优、良、中、及格、不及格。这样的数据叫等级变量,又叫顺序变量,指在对事物进行分类时,依据事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。等级变量既可以反映教育现象的类别,又可以表示各登记间大于或小于的关系,如5>4>3>2>1。但是等级资料未测量出类别之间的准确差值,不能提供各等级之间差值大小的信息。因此,等级变量没有相等单位,无绝对零点,同组的各等级量数间不能进行加、减、乘、除运算。
等距变量是指在观测标识事物某一特定属性时,既能反映事物之间的先后顺序关系,又能反映事物之间距离关系的数据,具有相对参照点(读数的起点)和相等单位。如80名学生的测试成绩等。等距变量要借助于一定测量工具而获得,可以进行加、减运算,不能进行乘、除运算。适用于等距变量的统计指标有平均数、标准差、积差相关系数等。
比率变量指既有绝对参照点,又有相等单位的变量。如物体的长度、重量、体积,人的身高、体重、教师的教龄等。比率变量既可以确定一个事物比另一个事物大多少,又可以确定大多少倍。因此,比率变量的取值可以进行加、减、乘、除运算。
表2-1四种数据类型的特点
(注:“√”表示该尺度所具有的特性)
(二)按数据获得方式,可分为计数数据和测量数据
计数数据是以计算个数的方式获得的数据,如参加考试的学生数、教师任教学科数、考试中及格与不及格的人数。计数数据具有独立的分类单位,以整数形式出现。
测量数据是指借助一定的测量工具或一定的测量标准而获得的数据,如学生各学科的成绩、学生的交往能力、人的智商等。其特点在于数值的连续性,是一种近似值,存在测量误差。适用于测量数据的统计方法有平均数、标准差、积差相关系数、Z检验、t检验、F检验等。
(三)按数据的分布形式,分为离散数据和连续数据
离散数据是指量尺上其取值有限且彼此不连续的数据。其特点是代表数轴上可能取到的有限个点,任何两个数据点之间所取的数值个数是有限的,以整数形式出现。如参加考试学生数80人、女教师人数20人、教师所教学科数3门。
连续数据指在一定范围内连续变化、取值无限多的数据,它可能的取值范围充满整个区间。一般规定:一个连续变量的取值是指大于或等于该数值的实下限,小于该数值的实上限的那些连续变化的数值。如学生成绩为88分,实际上是指大于或等于87.5而小于88.5的所有数值,即 [87.5,88.5),是一个左闭右开区间。实限的表示方法是连续变量取值的表述形式加上它最末一个数位的半个单位值为实上限,减去它最末一个数位的半个单位值为实下限。
例1 确定连续变量取值12.5的实限。
解:12.5最末一个数位的单位值是0.1,一半是0.05,所以12.5的上限是12.5+0.05=12.55,下限为12.5-0.05=12.45。即12.5的实际代表范围是[12.55,12.45)这一左闭右开区间,12.5是其表述形式。