当前位置:课程学习>>第三章>>文本学习>>知识点一
测验完毕得到测验分数后,需要对这些分数做出解释。在没有背景资料的前提下,任何心理测验的原始分数都不具有任何意义。例如,某人在智力测验中得了130分,某人在语言能力测试中得了20分,我们很难说130分就是智力高,20分就是语言能力低,因为这个分数不能提供足够的信息使我们做出解释。因此在解释分数时,我们需要一个参照系,即给予测验结果一个可以对照比较的参照体系,这个参照体系必须是确定的、统一的。当分数需要与一个固定的标准进行比较时,比如达到60分称为及格,这种解释方式称为标准参照。当分数需要与其他人的分数进行比较,从而得到个体在整体中的位置时,这种解释方式称为常模参照。
具体来说,常模是通过以一个能代表团体的平均表现分数为参照点,结合平均数和标准差,判断个体测验分数在总体中所占的位置。现在再来看我们之前的例子,个体在智力测验中的得分是130分,假设依据的常模平均数为100,标准差为15,那么我们可以说该个体的测验分数水平在平均数以上2个标准差,那么可以判断个体智力的相对水平是比较高的。这样有了常模就可以说明个体在常模样本中的相对位置,参照其他的个体评价测验分数;也可以直接比较同一被试在不同测验上的相对成绩。
常模团体(norm group)是由具有某种共同特征的人所组成的群体,或者是该群体的一个样本。它用一个标准的、规范的分数表示出来,以便提供比较的基础。
(一)对测验编制者而言,常模的选择主要是基于对测验将要施测的总体的认识,常模团体必须能够代表总体。
这个过程包括确定一般总体、确定目标总体样本。例如,研究高中学生的主观幸福感问题,其一般总体就是高中生;而目标总体是计划实施的对象,如计划实施的全国各高中的高中生样本的选择则必须根据总体的性质,如性别、年龄、文理、家庭背景等。找一个有代表性的样本来代表目标总体,也代表一般总体。满足所有条件后才可以称为常模样本,才具有代表性。
(二)对测验的使用者来说,要考虑的问题是要选择一个合适的常模团体,现在的常模团体哪一个最合适。
标准化测验通常提供许多原始分数与各种常模团体的比较转换表,被试的分数必须与合适的常模比较。而且有时能够适合的常模团体不止一个。例如在进行人员安置时,同一个测验分数就可以与各种不同工种的常模进行比较。
确定常模团体需要注意的几个问题:
1.任何一个测验都可能有许多可能的常模团体。
2.常模团体必须能够代表总体。
3.选择最适合的常模团体。
4.常模团体的定制有很多标准。
(如:年龄、性别、学历、种族等)
(1)群体的构成必须明确界定。
由于每个测验的都可能含有多个常模,因此针对每个常模团体必须明确界定其性质与特征,这样便于使用者根据测验的目的来选择合适的群体进行参照比较。区分和界定常模团体的变量涉及:性别、年龄、年级、职业、民族、地区、文化程度、社会地位等,根据这些变量的不同设定可以得到不同的常模团体。针对比较大的群体时,群体内部也有许多小群体,例如针对大学生群体时,群体内部包括男生、女生,或者文科、理科生,他们在同一测验上的表现经常有差异,如果这种差异显著影响测验结果,那么就需要针对小团体分别建立常模。而小群体间的没有差别或这差异较小时,可以建立统一常模。
(2)常模团体的代表性。
常模团体必须是所测群体的一个代表性样本。当所要测量的目标群体较小时,可以测量群体中的全部成员从而得到常模,这种常模团体就是具有共同特征的一个群体,如果所测量的目标群体比较庞大,由于客观条件的限制无法做到全部测量,那么可以抽取一部分人作为该群体的代表进行测量,这种常模团体就是群体的一个样本。由于必须保证样本能够代表总体。因此所选取的样本必须在人口学特征方面(年龄、性别、地区、民族、经济地位、文化水平等)与总体的特征吻合。但是完全的代表性是一种理想,除非采取普查的方式,否则是很难达到的,同时我们考虑的人口学特征越多,代表性就越难以达到。要想得到较高的常模团体的代表性,就要采用合理的抽样方法。一般在抽样时应采用随机化原则,采用科学的抽样方法,具体方法在下文中进行具体介绍。测验者大多依据所测量的心理特质选定哪些人口学变量会影响测验表现,进而设计具体的取样方法。
(3)样本大小适当。
要保证常模团体的代表性,不仅需要采用科学的抽样方法,必须保证样本量足够大,能够提供稳定的数值,从同一个总体中同样选择的另外一个样本,得出的两个常模不应该有显著差异。如果常模团体取样差异较大,常模的可参照价值就不高。根据统计学原理,在其他条件相同的情况下,样本越大所得到的统计误差相对越小,与目标总体的统计量越能够接近。但是由于客观条件的限制,在确定样本大小时 需要综合考虑经济实用性和减小误差两方面。同时可以依据总体数量、研究需要、群体性质、测试过程等方面进行进一步的衡量,同时还可以根据要求的可信程度和容许的误差范围推算样本大小。有时数据虽然来自较大的样本,但是由于样本的定义比较模糊代表性较差,反而不如较小的具有代表性的样本得到的数据可靠。因此必须在首先保证样本代表性的前提下使样本大小足够提供稳定数据。
(4)取样过程必须进行详细描述。
为了便于测验使用者清楚的了解常模团体的具体情况,判断常模是否符合自己的测验目的,防止错误的解释测验结果,在测验中必须对常模团体的取样过程进行详细的描述。描述内容需要涉及常模团体的大小、取样的时间,取样方法以及其他有关情况,这些内容越详细越好。同时还应当明确交代可能影响测验结果的有关人口学变量,如性别、年龄、民族、地域、文化程度、经济地位等情况。对常模团体取样过程的详细描述,保证了测验使用者能够根据这些信息判断受测者与常模是否可比。
(5)常模团体的时间性
在选择常模时必须注意使用近时的常模,也就是保证常模编制的时间和使用的时间之间不能有太大的差距。因为选取的常模团体是在一个特定的时间和空间当中的,他们只能代表当时当地的情况。如果使用的时间与之相差过于遥远,常模团体就不能很好的代表目标群体的情况,导致测验结果与常模团体之间缺乏可比性。另外如果建立常模团体的时间与使用常模之间发生了较重大的事件,可以使该群体在测验中的表现发生普遍性的改变,那么这个常模也就失去了可参照的价值,此时须重新建立新的常模才能保证对分数的有效解释。例如,某些智力测验,如果不进行及时的更新,那么现在个体所得出的测验结果与旧常模进行比较时,往往得到的结果会显得智商明显偏高。
(6)注意一般性常模与特殊常模结合。
前面我们已经提到常模团体根据具体的测验目的不同,针对的目标群体是不同的。不同的常模对不同的群体具有代表性。通常测验手册上的常模团体都是比较广泛和一般性的团体,并不一定适用于特殊情况。如盲人或聋哑人的智力就不适合与一般常模进行比较,因为一般常模采用的常模团体是这些方面能力健全的人,这样会导致解释结果存在偏差。因此这种情况下可以适当参照特殊常模进行分数解释。特殊常模是更为具体的,适合特殊状况的常模,这样就能够使受测者能够与最接近的群体进行比较。但是需要注意的是特殊常模也具有一定的缺点,它只能够提供特殊信息,使用的范围相对比较狭窄。因此可以根据研究目的和情况将一般常模和特殊常模结合使用,使分数解释更加合理。
(一)取样的定义
取样是指从目标人群中选择有代表性的样本。分为随机抽样和非随机抽样。
随机原则:从总体中取样时,所取个案不是人为地主观决定的,每个个案被抽取的机会均等。
(二)取样的具体方法
实际研究中,常常不能将所选择的群体中的每个个体都进行测量,所确定的常模团体往往是总体的一个样本,因此这就涉及到取样误差的问题。我们说常模团体必须是总体的一个有效代表,那么能不能有效的代表总体,取样工作起着至关重要的作用。抽样误差是一种由于抽样的随机性而带来的偶然的代表性误差。抽样误差越大,表明样本对总体的代表性越小,抽样结果也就越不可靠。减小抽样误差的有效方式之一就是选择合适的抽样方法。概率抽样能够使总体中的每个个体都有同等的概率被抽到,因此能够较好的代表总体,反应总体在测验中的作业情况。常用的抽样方法包括:简单随机抽样、等距抽样、分层随机抽样和整群抽样。
(1)简单随机抽样
简单随机抽样是一种最简单的同时也是最能够反映随机原则的抽样方法。具体来说,就是直接从总体中抽取若干个体作为一个随机样本。每一个个体都有相等的独立的被抽取的可能。实际抽样时的常用方法有抽签法和随机表法。抽签法是把总体中的每一个个体都编上号码做成签,从中随机抽取一部分,被抽到的这部分个体就构成一个样本。随机表法同样是先给总体编号,然后按照随机表(由任意数字无规律而排列成的表格)选取个体组成样本。但是由于需要对总体进行编号,如果总体过大,那么这项工作将会非常庞大的,因此这种方法并不适用。同时由于对于总体中所有个体采取随机抽取的方式,容易忽略总体固有的一些信息,降低样本的代表性。另外,大规模抽样时,抽签法和随机表法在实际操作中都显得费时费力,所以这种方法虽然原理很简单,但是实际上应用较少。
(2)等距抽样
等距抽样是将个体按照无关特征编码,研究者随机确定一个起始点,以相同的间隔抽取个体,直到都达到样本数量。抽取的间隔可根据总体大小和样本大小确定。总体(N)与样本量(n)的比值为K(K=N/n),K就是抽样的间隔数。例如研究某高中三年级学生N=500的职业兴趣方向,采用等距抽样,样本定为n=100,因此K=5,即每隔5个人抽取一个被试,如果以学号进行编码,第一个随机抽取的学好为06,那么依次为11、16、21、26……系统抽样方法能够群体的在总体范围内系统的抽取样本。比简单随机抽样更加精确,更具有代表性。同时它简便易行,但是如果总体中的各单位有明显的周期性循环变化,那么不宜采用这种方法。
(3)分层随机抽样
分层随机抽样就是按照总体已有的特征,将总体分为若干个组,然后分别在每个组中随机抽样。这些组就是所谓的层,总体中的每个个体都独立的属于某一个层,不能有交叉。每一层中随机抽出的个体共同构成了样本。也就是说,首先根据总体的内部结构确定各层的被试在样本中所占的比例。因此对总体分层所依据的标准必须符合实际。因此抽样之前必须对研究对象进行科学的了解。分层抽样的一个重要原则是各层的变异要小,而层与层之间的变异越大越好。具体的实施方式有两种:一种是按照各层的人数比例分配,即人数多的层分配到样本中的人也多,这是层内标准差未知的情况下常用的方法;另一种是不仅根据各层的人数比例,同时考虑到各层的标准差,标准差大的层多分配。这种方法充分的利用的目标总体的结构信息,具有较高的样本代表性。
(4)整群抽样
整群抽样是指以一个相对独立的团体为单位随机抽样,这样被试就以各种自然存在的团体为单位参加抽样,这些团体可以是班级、工厂、医院等。研究者首先需要将总体细分为组,然后从细分后的组中按照一定标准抽取若干团体作为样本。与分层抽样相反,这种方法是要减小单位团体之间的差异,尽可能加大团体内部个体之间的差异。如果只抽取一次,即将抽出的团体全部放入样本,每个团体都有同等机会被抽到,那么称为一阶抽样。如果在此基础上,针对每个已经被抽取的群体中包含的小群体,再抽取一定比例的小群体,将所有抽取的小群体纳入样本,称为两阶段抽样。例如,对某市五年级学生进行语言能力测验,两阶段抽样可以这样进行,第一阶段以学校为单位进行随机抽样,第二阶段,在抽取的每个学校中以一定的比例抽取学生,同时保证人数多的学校比人数少的学校的学生抽到的概率更高。这样就保证了所有人被抽到的机会是均等的。当面对大而复杂的总体时,整群抽样是相对比较方便的,但是由于各个团体在总体中的分布是不均匀的,因此存在较大的抽样误差。
(一)常模分数
常模分数就是施测常模样本被试后,将被试的原始分数按一定规则转换出来的导出分数。
原始分数本身没有多大意义,必须按照原始分数的分布与现代数理统计方法转换成导出分数,才变成一个有意义的量表。
原始分数反应了被试对题目的个数或作答正确的程度,但是却不能直接反映出被试之间的差异状况,不能刻画出被试相互比较后所处的地位,也不能说明被试在其他等值测验上应获得什么样的分值。所以必须按照原始分数的分布与现代数理统计方法转换成导出分数,才变成一个有意义的量表。导出分数(derived score)就是在原始分数转换的基础上,按照一定的规则,经过统计处理后获得的具有一定参考点和单位,且可以相互比较的分数。常用的导出分数有百分等级、标准分数、T分数。这个按照某种规则将原始分数转化为导出分数的过程即为分数的转换(score transformation)。
(二)常模(norm)
常模(norm)又称为测验常模,是一种描述由个体所组成的总体的行为特性的概念,这种总体行为特征的描述一般需要借助于测验才能实现。因此常模可以直接的解释成一个总体关于某一被测量对象(即心理属性)确定的特殊分数的分布状态。
1.常模是针对一个具体的总体而言,从理论上说这个总体的容量应该是无限大的,而且在实践中其容量也的确非常大,因此要产生一个总体的常模并不是一件简单的事,因为测验一般不可能对整个总体实施。所以,常模产生的关键在于寻求一个代表总体的样本,即标准化样本。常模可根据标准化样本的测验分数经过一定的数据统计处理而产生。
2.常模一般可分为一般常模和特殊常模。
(1)一般常模是指测验手册上所列的常模,通常为测验指导书上列出的常模,代表的总体分布的范围很大(譬如全国性的),并不一定适合使用者的具体情况。
(2)有时,测验使用者可能认为现成的标准化样组所代表的总体分布的范围太大(譬如全国性的),因而想利用比测验手册上所得到得更为局限的标准的样组,这是需要各种特殊常模。这是常模可以应用于“一家大型企业的员工”或“一年级机械专业的学生”。为了许多测验目的,需要各种特殊常模。许多变量可以用来选择各种子体:年龄、年级、文化程度、性别、地域、城市或农村、社会经济水平等。特殊常模的建立方法,根据样本的原始分数制作次数分布图,再计算出导出分数,最后制成转换表。
(3)特殊常模为非典型群体建立的,如某个单位。最常见的特殊常模之一就是地方性常模。地方性常模的主要优点是,它使个人与最近的人做比较。例如,地方上的学生在与学业成绩有关的因素上(如能力或社会经济背景等)可能与全国不同。当有这种差异发生时,地方性常模能代表较好的比较标准。特别是我国幅员广大,各地发展又不均衡,如果能建立地方常模,并把它与全国常模参照使用,将会取得较好的效果。由于地方常模涉及较窄范围的资料,因此,它不像全国常模能提供更有效的信息。
常模是总体(或叫标准化样本)测验分数的分布形态,其本质上只是一种分布状态,而由于分数表达方式的不一样,则它可以有多种分布形式。每一种分布形式都可以以其分布形式的某些参数(如平均数、中位数、等级位数等)简单地表示。常模的解释也只能局限于具体的测验属性之内。例如不能用8岁儿童组计算能力常模去解释8岁儿童的阅读能力。