当前位置:课程学习>>第一章>>文本学习>>知识点三


第一章 心理测量和心理测验概述



知识点三 心理测验


心理测验是了解人心理的工具,主要在“名词”意义上使用。而心理测量则是以测验为工具,达到了解人类心理的实践活动,它主要在“动词”意义上使用。因此,心理测量的意义范围更广一些,能被应用于实际心理测量的心理测验才是真正有效的测验工具。

一、心理测验的要素

心理测量和心理测验是常常易被混淆的概念,它们既有联系也有区别,本节将在之前掌握心理测量概念的基础上学习心理测验的具体知识,以下将介绍心理测验与心理测量的关系、心理测验的要素、心理测验的客观指标、心理测验的分类及其功能。

1.行为样组

行为样组是指心理测验中选择一部分测量人心理特性的有代表性的行为。因为心理测量的对象是人的心理特性,而测量心理特性又是凭借对其密切相关的行为间接测量的,在一个心理测验中,不可能把所有与该心理特性相关的行为全部测量到,而只能选择其中一部分行为进行测量。在编制测验时,必须慎重地选择有代表性的行为样组。

2.标准化

标准化是指测验的一致性,包括测验的编制、实施、记分以及测验分数解释的程序的一致性。这样才能保证在相同的条件下进行比较,比较的结果才有意义。标准化的范围包括:测验用品的一致性,测验指导语的同一性,测验中主试与被试关系的稳定性,测验评价的一致性等。所有能保证测验条件一致性的都是标准化应考虑的内容。标准化的另一重要步骤是建立常模。

3.客观性

指测验不受主观支配,其测量方法可以重复,测验实施、记分和分数的解释都是客观的。行为样组的标准化都是为了使测验客观。

二、心理测验的客观性指标

1.信度

信度,即测验的可靠程度,是对测验结果的一致性的估计。一个好的测量工具必须稳定,每次测量的结果要保持一致,否则便不可信。由于系统误差(也就是恒定误差)对测验的影响是恒定的,所以信度只考虑随机的,偶然的误差影响(如被试样本、实施条件、动机水平和注意力等等)。随机误差越大,信度越低。

信度的估计方法有以下几种:

①重测信度:同一种测验,对同一组被试,前后施测两次,再根据被试两次测验分数计算其相关系数,即得重测信度。重测信度所考虑的误差来源是时间的不同所带来的随机影响。

②副本信度:两个平行的测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。如果两个复本是同时连续施测的,称这种复本信度为等值性系数。如果两个复本测验时相距一段时间分两次施测的,称这种复本信度为稳定性与等值性系数。

③分半信度:一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。分半信度通常是在只能施测一次或没有复本的情况下使用。

④同质性信度:也叫内部一致性系数,它是指测验内部所有题目间的一致性程度。题目间的一致性含有两层意思:一是指所有题目测的都是同一种心理特质;二是指所有题目得分之间都具有较高的正相关。

⑤评分者信度:多个评分者给同一批人的答卷进行评分的一致性程度。

2.效度

(1)内容效度

表示测验所选的项目符合所欲测验内容的程度。对智力测验而言,内容效度就是指测题的选样是否具有代表性。确定内容效度的方法有两个:a)逻辑法:即请有关专家对测验题进行考核,看测验是否能够测出所有测的内容;b)经验法:即通过实践检查测验能否测出欲测的内容。

(2)结构效度

表示测验实际测量出所欲测量的心理结构或特征的程度。

(3)效标关联效度

又称实证效度或准则关联效度,它是测验分数与作为效标的另一独立测验结果之间的一致程度。效标关联效度又可分为两种。效标分数与测验分数同时获得的,成为同时效度。效标分数在测验之后一段时间(几个月到几年)获得的,成为预测效度。前者主要用来查明修订或自编测验的效度,后者主要用来评价测验的预测能力。

3.难度

项目难度是衡量测题难易水平的数量指标。估计项目难度的方法通常是以被试通过每个项目的百分比来决定的。如果某一项目通过百分比太高或太低,这说明该项目太易或太难。

4.区分度

指测验项目对被试心理品质差异的区分能力。如果一个测题的区分度高,那么水平高的或能力强的被试就会得分高,水平低或能力弱的被试就会得分低,这样就能把不同水平的被试区分开了。

三、心理测验的分类

(一)按内容分类

1.能力测验

能力测验可分为实际能力测验与潜在能力测验。实际能力是指个人已有的知识、经验与技能,潜在能力则是指个人将来可能达到的水平。能力测验还可分为普通能力测验与特殊能力测验,前者即通常说的智力测验,后者多用于测量个人在音乐、美术、体育、机械等方面的特殊才能。常用的能力测验如斯坦福-比奈智力量表、能力倾向测验等等,前者即是实际能力测验也是普通能力测验,后者是潜在能力测验。

2.成就测验

成就测验是测量人在接受正式教学和训练之后对所学知识、技能掌握程度的测验。包括学科测验和综合测验。后者如都市成就测验(MAT),前者有语文学科测验、数学学科测验等。

3.人格测验

它测量的是个性中除能力以外的部分,即非能力测验。主要测量性格、情绪、需要、动机、兴趣、态度、焦虑、气质及自我概念等方面的个性心理特征及其相关行为。

(二)按测验功能分类

1.显示性测验与预测性测验

显示性测验测量受测者在特定领域所取得的成就(知识、技能、能力),如学校里的单元测验、期末测验。预测性测验的功能在于预测受测者将来在某些领域或活动上的行为表现和绩效。如升学测验、招工测验、公务员录用测验等。预测测验所测量的行为,与我们所关心的、所要预测的行为可能是不相同的,但是二者必定有高度的相关。

2.概观性测验与诊断性测验

概观性的测验是要对受测者在某领域行为或心理特质(学习状况、心理健康状况等)作总的了解,以确定他们在团体中的地位,或对他们达成某种标准的情况作普遍性的考察。而诊断测验则要根据目标,逐项地考察受测者的实际状况,找出他们的优势和不足,重点是考察其薄弱环节,以便有针对性地提供帮助。学习诊断性测验通常要对照课程标准,列出各知识基本要点逐项予以测试,题目涵盖面较广,探查力强,难度由易到难排列。

3.教育测验、职业测验和临床测验

按照测量应用的领域,可以把测验分为教育测验、职业测验和临床测验。教育测验指用于学校教育情境中的测验,虽然各种能力、人格测验和心理健康问卷都可以在学校应用,但学校中应用最多的还是成就测验。因此教育测验通常主要是指成就测验,也称学绩测验。教育测验中还有一些功能特殊的测验,如以考察学生学习困难和缺陷为主的学习诊断测验,考察学生学习准备状况以决定学生能否进入下一阶段学习的学习准备测验。

职业测验是用来帮助个人和企事业单位做职业决策、人员选拔、安置、评估的测验。主要有职业信念测验、职业兴趣测验、职业价值观测验、能力倾向测验等。

临床测验是用于医学临床诊断的测验,一些重要的智力测验、人格测验都有临床诊断功能,如韦克斯勒智力量表有诊断学习失能类型的功能。而明尼苏达多相人格问卷主要用于精神障碍的诊断。此外,还有一些专为医学临床诊断设计的测验,如神经心理学测验、儿童心智缺陷测验和心理健康问卷。

(三)按测验材料和测量方式、手段分类

1.文字测验和非文字测验

文字测验的材料是文字,受测者用文字或口头语言作答。也称言语测验,实施比较方便。非文字测验所用材料是图形、实物、工具或模型等,大部分非文字测验也称操作测验。被试需用手工操作方式作反应,其优点是不受被试文化程度和语言表达能力的影响,缺点是只能个别操作,时间上不经济。

2.团体测验和个别测验

按照测量方式,可将测验分为团体测验和非团体测验。实施团体测验时,一位施测者(有时需配备几名助手)可同时对多数受测者施测。团体测验的材料是文字的或图形的,题型多用选择题,受测者用纸笔完成,现在计算机化的团体测验也被普遍使用。实施个别测验时,一位施测者只能同时对一位受测者施测,并对受测者的反应记录和赋分,此时施测者对受测者的反应有更多的观察和控制,有建立合作关系的更好的机会,但比较费时。对于操作测验,对于年幼儿童,对于阅读能力受限、语言技能较差的测试对象,通常要使用个别测验。

3.计算机化测验和非计算机化测验

按照测量使用的手段,测验可以分为计算机化测验和非计算机化测验。计算机化测验指受测者按照计算机指令通过计算机操作完成作答的测验。包括基于计算机的测验、计算机自适应测验和基于网络的测验。非计算机化指对文字图形材料用纸笔反应、对实物材料用手工操作完成的传统测验。

(四)按分数解释的参照分类

1.常模参照测验

常模参照测验对个人分数的解释,以常模团体在测验上的一般作业水平为参照系统。许多智力测验、人格测验都是常模参照测验。

2.标准参照测验

标准参照测验以在测验内容领域事先设置好的某种标准为参照,对受测者的测验分数作出解释,确认其是否达到这一标准。学校教学中采用的掌握测验、为执行行业准入制度而举行的各种专业资格考试都属于标准参照测验。

(五)按标准化程度分类

如前所述,标准化是测验本身的要求。但真正严格标准化测验的编制非常困难,成本较高,编制周期长。要求在各种场合都使用严格标准化的测验既不现实、也不必要。我们不妨把标准化看作是一个渐进的过程或系列。由于测验标准化程度不同,也就有了标准化测验和非标准化测验之分。非标准化测验并非完全没有标准化的要求,只是由于条件限制或使用目的允许,其标准化程度未达到严格要求。教师自编测验多为非标准化测验,由于其针对性强,使用灵活,在教学中仍能发挥其积极作用。


四、心理测验的功能

测验作为一种重要的社会管理工具,在学校、企事业单位、军事部门、医疗机构中有着广泛的应用。概括地说,测验的功能是为我们作出关于人的决策提供真实、有用的信息,具体体现在以下几个方面。

1.选拔

测验在军事、工业、企业、艺术、体育领域被普遍用来选拔合格人员和优秀人才。特别是当申请者人数多于录用者时,测验帮助我们把最有成功把握的人员挑选出来。因为测验的内容结构是根据职业、职位、活动对人的心理特质的要求来设计的,故能为正确作出选拔决策提供有效信息,提高选拔效率。又因为测验编制、施测、评分是标准化的,对于所有申请者是一视同仁的,这就便于对测量结果进行比较,有利于实现选拔工作的社会公平。

2.安置

安置是根据受测者在兴趣测验、特殊能力测验、学业成就测验上的得分,将他们分配到不同兵种(在军队里)、不同工种或职位(在企业或机关里)、不同教学班级(在学校里),以使他们在适合自己的工作环境和教学条件下发挥自己的才能,或获得充分发展。

3.资格认定

资格认定在对学历和对行业、职业人员管理中,测验可用做确认申请者是否具有相关学历水平和专业资格的一种重要决策手段。如同等学力人员申请硕士学位外语水平和学科综合水平全国统一考试、驾驶执照考试等,都具有这样的功能。

4.诊断

测验的诊断功能侧重于发现受测者某方面的缺陷和困难,以便采取措施予以矫治或补救。许多心理测验和评定量表除了应用于精神病临床诊断、脑功能障碍诊断外,也广泛应用于婴儿发展诊断、老年人心理衰退诊断、心理健康诊断和学业困难诊断。例如神经心理学测验就是依据对个体在感觉、认知、动作、情绪等领域的行为与脑功能之间关系的认识,采用测验手段,对大脑损伤和机能障碍的性质和定位进行有效诊断的。

5.评价

测验为评价提供信息和证据。在教学过程中,根据测验结果,可以评价学生对所学知识、技能掌握情况,或确定学生个人在班级中的相对地位,为实施个别化教学提供有益的建议。同时班级学生在测验中的表现也是评价教师教学效果的重要信息源。

6.职业指导

智力测验、人格测验、能力倾向测验、职业兴趣测验等可以作为职业指导的工具,帮助人们实现工作特点和人的心理特质的最佳匹配,并促进个人职业发展。类似地,测验结果也可为指导学生选择专业、选择课程提供参考。

7.研究工具

测验除了为上述各项实际决策提供信息外,对人们的理论决策也能提供帮助,这主要是指测验可为开展心理学实证研究,形成理论概括搜集量化资料。首先,利用前测对被试的一些重要心理属性进行测量,是实验设计中划分等组的常用方法;当发现通过非随机分派得到的两个被试组在某些影响因变量而又与研究目的无关的变量上水平不相等时,前测的结果也为通过协方差分析控制这些无关变量提供必要数据。其次,测验为检验假设或有关理论提供了数据资料。所谓研究假设,就是对变量间关系的一种推测性的陈述。为了运用统计方法检验这些假设,就必须首先将这些变量操作化和数量化。而测验是获取关于人的心理属性的数量化资料的重要方法。