当前位置:课程学习>>第八章>>文本学习>>知识点一
心理测验的目的是要对被试的行为作出尽可能准确的估计,这种准确的估计与其它科学测量一样必须依赖于对误差的控制。然而测验的分数不仅会受到与测验目的有关的变量的影响,而且也可能受到与测验目的无关的变量的影响。换言之,测验分数不仅取决于测量工具本身,也同时受测验实施过程的影响。在测验实施过程中,必须遵从标准化的程序,使测验的各种情境对所有受测者尽可能相似,以控制无关因素对测验结果的影响。本章将对测验实施的条件、前期准备和测验过程中的误差及控制等有关内容作以介绍。
(一)知识结构要求
主试应具备开展心理测验所必备的基础知识和与专业相关知识。在基础知识方面,主要包括普通心理学、发展心理学、社会心理学以及心理统计学等广泛的心理学基础知识。在专业知识方面,除了精通人格心理学、能力心理学、变态心理学外,还应根据自己的工作领域具备相应的本行业的专业知识。
(二)专业理论知识和专业技能要求
1.专业理论知识。掌握心理测验专业理论知识,这是主测者资格考察的最基本条件。具体言之,它包括要求主测者对心理测验的特点和性质、作用和局限性有清楚的认识;了解测验的基本特性,如信度、效度、难度和区分度等心理测量学指标;熟悉心理测验标准化的必要性等。
2.专业技能。主试者必须具有实际操作心理测验的专业技能和经验,接受严格、系统的心理测验专业训练,熟悉有关测验的内容、适用范围、测验程序和计分方法等。由于个别测验对主测者的要求很高,其测验能否取得预期效果在很大程度上主要依赖于主测者的水平。至于人格测验中的投射测验,由于没有实现标准化,因而对主测者的要求更高,担任这些测验的主测者必须是经验丰富的临床心理咨询专家或精神科医生。
此外还必须指出,即使某人具备了心理测验主测者的资格,可以熟练地担任某些测验的主测者,但并不意味着他可以担任其他测验的主测者了。各种测验名目繁多,新的测验不断产生,一名已经具有主测者资格的测验工作者仍然面临不断学习和提高技能水平的任务。 (三)职业道德要求。
1.测验的保密和控制使用。主试需要做到对测验的保密,不可泄露,刊登。控制测验的使用,只有专业人员才能使用。
2.测验中个人隐私的保护。在测验工作中,尤其是人格测验工作中经常遇到的一个不可忽视的问题是侵犯受测者的个人隐私问题。例如,在人格测验中,有的条目可能涉及人们的家庭关系、内心冲突、私人生活等问题。心理测验工作者应尊重受测者的人格,对测验中获得的个人信息要严格保密,并由有资格的专业人员妥为保管,除非对个人或社会可能造成危害的情况,才能告知有关方面。
选择测验时应注意如下问题:
(一)所选测验必须适合测量的目的
测验是进行科学研究和解决实际问题的一个工具,测验的选择首先必须符合测验的目的。由于每一个测验都有其特殊的用途和使用范围,所以测验施测者首先就应当对各种测验的功用及特长、优缺点有一个了解。此外,不但不同的目的要选用不同的测验,而且不能只根据测验名称盲目选择测验,必须了解该测验的真正适用范围和功效,否则就会造成测验使用不得当。
(二)所选测验必须符合心理测量学的要求
选择测验时,还应考虑该测验是否经过了标准化,它的信度、效度如何,常模样本是否符合测试对象,常模资料是否太久而失效等。即使是真正的心理测验,倘若由个人自行施测,不懂得分数如何解释,也会产生不良后果。因此,不具备心理测验知识的个人最好不要自己盲目选择测验及自行施测、解释,而应由专门的心理测验机构的专门人员来操作。
1.测验材料
测验用的材料要提前准备好。按照受测者人数准备足够的测验题册、答题纸。对操作性测验的用具要一一清点备齐,放在合适的地方。有时还要准备答题用的笔、铅笔刀等材料。如果使用电脑进行测验,则要检查测验程序的运行是否正常。
2.安排测验时间和场所
合理安排测验时间和地点是测验标准化的要求之一。时间、地点等环境条件增加了测验的偶然因素,测验时应按照测验说明书的要求安排时间和场所。
3.培训主试
主试也是测量误差的来源之一,因此,正式测验前要对所有主试进行培训。培训内容要一致,时间要足够。主试要熟悉整个测验的内容、程序和要求,包括指导语、施测顺序、时间控制、评分细则等。如果条件允许,最好能演练。对一些施测过程比较复杂的测验,如智力测验,应该演练到熟练的程度方可进行正式施测。
1.指导语
主试宣讲指导语和受测者接受指导或阅读书面指导语,是测验正式作答之前的必要环节。其作用是使受测者弄清测验的目的要求、如何作答以及时间限制等。主试宣讲指导语一定要严格遵循测验指南,不能随意增删变动。受测者有疑问,主试应该按照指导语进行解释,不能任意发挥。
2.建立协调关系
协调关系(rapport)是指心理测验中主试与受测者之间一种友好、合作、能促使受测者最大限度地完成测验的关系。测验过程中,主试应当在语言、态度或者行为等方面尽量作出友好的表示以促进这种关系的建立,从而激发受测者应试的积极性。如,在智力测验中,协调关系可以促使受测者尽最大努力发挥自己的能力;在人格测验中,它可以促使受测者真实地回答个人的行为表现。
对于成人受测者,应当强调测验的作用,以鼓励他们尽力答题并减少作假。对于学前儿童,为避免儿童因在生人面前胆小、羞怯而影响回答,主试应当以友好、快乐和温和的态度与其交流。必要时可以事先与儿童一起游戏玩耍,待儿童与主试熟悉后再进行测验。
3.测验环境
规范、统一和符合要求的测验环境是保证测验质量的重要条件。测验环境首先必须完全遵从测验指南的规定和要求进行安排布置,同时要对测验环境的采光、通风、温度及噪音影响等物理条件加以考虑,统一布置,防止不利于测验的情况发生。在测验过程中,还要排除外界干扰,与测验无关的人员不能进入测验场所。如果测验中发生了任何以外的环境情况,要如实记录下来,在解释测验结果时应考虑这一因素。
4.时间控制
时间限制是标准化测验的一项重要要求。在最高行为测验中,答题一般都有时间限制。在智力测验中,有些题目在一定时间回答不出则不允许再答。速度测验更是将时间作为评分的指标。所以,主试必须严格按照测验的规定加以控制,不得任意延长或缩短测验时间。在典型行为测验中,一般没有时间限制。
每个测验基本上测量的都是被试学习的结果,在多数情况下,由一般学习经验或发展变化所引起的分数差异被认为是恒定的,而且每个被试在一定限度内基本相同。然而这种假设在实际中并不尽然。即使一个测验经过精心编制,题目取样具有代表性,又有标准化的实施和记分程序,但由于被试以及主试自身的某些变化,就仍会给测验分数带来影响,这种误差是最难控制的。本节将从来自被试方面的误差和来自主试方面的误差两部分来进行讨论。
(一)来自被试方面的误差
1.应试技巧
被试对测验的经验或技巧会影响测验的成绩,例如在一些具有复本的测验中,有些被试的第二次测验分数往往较高。还有一些研究表明,无论是小学生、中学生、大学生还是公司员工,在测验后立刻施测复本、1天后施测复本,测验的平均分数都显著提高。这是因为被试在经历过多次测验后掌握了一定的答题技巧,虽然他们对测验的内容不那么了解,但具有较高测验技巧的被试会及时适应测题形式,他们善于觉察正确答案与错误答案的细微差别,懂得合理的分配时间,因此经常比那些与他们能力相当但缺乏测验技巧的被试获得更高的测验分数。
2.练习效应
在涉及个体认知功能的测验上,由于被试参加过相同或重复的测验,对测验的内容和程序已经比较熟悉,这时,就会由于练习效应的存在而使测验成绩提高。练习对测验成绩的影响情况如下:
① 教育背景较差、经验较少或智力较高者,其受练习效应的影响较大;
② 着重速度的测验,练习效应较为明显;
③ 重复实施相同的测验,受练习效应影响的程度要大于复本的测验;
④ 两次测验之间的时距越大,练习效应越小,相距三个月以上练习效应可忽略不计;
⑤ 一般的平均练习效应,约在1/5个标准差以下,并且仅限于第一次及第二次重测,第三次以后练习效应增加不明显。
要控制测验技巧和练习效应的影响,可以尽量设法使每个被试对测验材料、步骤和所需技巧有相同的熟悉程度。另外,还要提高标准化测验的题目编制水平,对于编制较好的标准化测验题,提高测验技巧并不能提高其测验分数。
3.应试动机
被试参加测验的动机不同,自然会影响其回答问题的态度、注意力、持久性以及反应速度等,从而影响测验的成绩。
在测量成就、智力和能力倾向等变量时,只有被试动机强烈,才可能尽力作答,取得好成绩。某些社会地位不高的被试,对测验的动机不强烈,则其能力往往被低估。例如,有研究表明,黑人儿童和白人儿童在测验分数上的差异反映的就不全是能力的高低,其中还掺杂有动机效应。
被试的应试动机对兴趣测验、态度测验、价值观测验、人格测验等也有影响。例如,被试可能为了给他人留下一个美好的印象,就会揣摩测验的目的、主试的期望,或者考虑社会赞许性,在答题时会去积极迎合,而不是按照自己的实际情况作答。
如果被试的动机效应在反复测量中以一种恒定的方式出现,就会导致系统误差,从而使测验的有效性降低;如果动机效应引起的是偶然的不稳定的反应,就会产生随机误差,致使测验的有效性、可信性都降低。
4.测验焦虑
测验焦虑是指被试因接受测验而在测试前和测试中出现的一种焦急、紧张和恐惧的不愉快情绪体验。测验焦虑有两个重要的组成成分,即情绪反应和消极认识。情绪反应包括紧张、心跳加快、呼吸急促、出汗之类的感觉和生理反应;消极认识包括预计自己做不好测验、担心失败之类的消极自我定向想法,属于焦虑的认识成分。
测验焦虑会分散被试对测验所要求的任务定向行为的注意力,影响被试作出正确的判断和及时的反应,从而影响测验结果的真实性。例如,进行操作性测验时,被试由于过度紧张会使手眼失去良好的协调,导致测验成绩降低。一般而言,适度的焦虑会使个体维持一定的兴奋水平,使个体注意力增强,反应速度加快,从而对测验产生积极的影响;过度焦虑会使被试注意力分散,思维狭窄,反应速度减慢,对测验产生消极影响;如果被试没有一丝一毫的测验焦虑,往往意味着被试的应试动机不强,因而成绩常常偏低。
测验焦虑会给测验结果造成消极的影响,主试应及时处理,有时主试可以利用保证测验结果绝对保密、明确告诉被试测验目的、使用清晰简洁的指导语、鼓励被试等方法来降低或消除被试的测验焦虑。
(五)反应定势
反应定势亦称反应风格(response sets or styles),是指独立于测验内容的反应倾向,即由于每个人回答问题的习惯不同,而使能力相同的被试得到不同的测验分数。如饥饿、疲劳等生理原因会产生某种单调消极的反应定势,个人偏好或某种态度等心理原因会使被试倾向于选某一特点的答案,等等。
现将几种常见的反应定势对测验的影响分述如下:
①求“快”与求“精确”的反应定势
有些被试,不管题目的内容和难度如何,总是谨小慎微,慢慢琢磨,答题比别人慢,表现为求“精确”的反应定势;另一些被试答题时习惯于特别快而粗心大意,表现为求“快”的反应定势。一般来讲,如果测验有时间限制,或测验本身属于速度测验,则求“精确”的反应定势必将降低测验成绩;如果纯粹是难度测验,则求“快”的反应定势同样会降低测验成绩。
为避免这两种定势的出现,除非“反应速度”本身即为重要的研究目标,否则应让被试有充分的时间反应,同时应该注明每题的答题时间,以减少求“快”与求“精确”定势的影响。
②喜好正面叙述的反应定势
大量研究发现,被试在无法确定“是非题”的答案时,选择“是”的人往往多于选“否”的人,或者说选“是”的人多于实际上应该选“是”的人,表现为喜好正面叙述的反应定势,亦称“肯定定势”。更有趣的是,有些编 制者在编制是非题时,也有“是”多于“否”的倾向。故在编制是非题时,“是”“否”题大致相等或答“否”题略多,是控制肯定定势的有效方法。
③喜好特殊位置的反应定势
在完成测验的过程中,被试如果完全不知道选择题的正确答案,则不会以完全随机的方式来决定该选哪一个选项,而有喜好选择某一位置的答题倾向,如A、B、C、D、E选项中B、C或D选项。同时,有些测验编制者也存在喜好某个位置的反应定势,例如,很少将正确答案安排在第一个选项或最后一个选项。所以,在测验编制过程中,使正确答案的位置在整个测验中出现在各个位置的概率相等,可以有效的控制这种位置定势。
④喜好较长选项的反应定势
有些被试会认为选项长、内容多的一般是正确答案,因此,在无法确定何者正确时,就会产生偏好长选项的定势。在编制测验时,只要尽量使选项的长度一致,就不难避免这类问题。
⑤猜测的反应定势
有些被试不愿猜测,即使事先告诉他要答完所有题目,也无法使他改变;相反,还有些被试却敢于猜测,即使告诉他答错要倒扣分,还是无法阻止其猜测行为。而猜测确实可以提高成绩,因此,如果不对猜测进行修正的话,那些敢于猜测的被试将比谨慎的被试更容易得高分。当我们怀疑被试的成绩中有很大的猜测成分时,我们可用下面的公式进行校正:
S=R―W/(K―1)
S—校正后的分数;R —被试答对的题目数;W —被试答错的题目数;K —选项数目
6.生理因素
生病、疲劳、失眠等生理因素,以及在智力、情绪、体力等方面的生物节律也会影响测验成绩,从而带来测验误差。例如,有些大学生习惯于晚上做作业、看书、学习,白天睡觉,或者晚上睡得很晚,早上起的也很晚,在以大学生为被试进行测验时,如果把测验安排在早上八点开始,由于受本身生物钟的影响,这样的被试在测验中就可能不会表现的很好。
二、来自主试方面的误差
测验实施的过程,是主试与被试互动的过程,不仅需要被试的参与,也需要主试的指导。在测验实施时,除了被试本身的某些变化会对测验结果产生影响之外,主试的操作及其自身特点也同样可能会给测验分数带来误差。
(一)主试的操作
主试对测验的操作主要包括测验前的各项准备以及在测验实施时的表现。其中,主试是否向被试预告了测验,是否把测验所需的材料准备的足够充分,是否熟悉测验的指导语和具体程序,对测验环境的布置是否合理等等,都会影响到测验能否顺利进行。例如,主试对测验的指导语不够熟悉,在对被试宣读或给予被试指导时,就会磕磕绊绊,影响被试在测验中的反应;主试对测验的环境布置不合理,如光线太暗、测验时的噪音太大、室内温度过高或过低等,同样会影响被试的反应。另外,如果测验过程中出现意外情况(被试身体不适等),主试的处理方式是否得当,测验结束后的计分是否客观、正确等,都可能会给测验带来误差。
(二)主试自身的因素
除了主试的操作之外,主试自身的一些特征也会对测验结果产生影响。
1. 主试的特征
主试的年龄、性别、种族、外表、职业、社会经济地位、训练和经历等,这些主试本身的特点都可能会影响到被试对测验的反应。例如,在一项关于自我展示(self-presentation)的研究中,主试首先要求被试完成某种认知任务,随后让被试与不同性别的主试进行交谈,然后再次要求被试完成之前的认知任务,最后比较两次认知任务的成绩,结果表明,相比与同性别主试交谈的被试,与不同性别主试交谈的被试的认知成绩有所下降,即主试的性别影响了被试在认知任务中的表现。
2. 主试的动机
主试在主持测验时会有不同的动机,例如希望提高自己的施测技能、完成某项学术研究等。有些主试为了显示自己在选拔和录用人才时的严肃认真,往往故意制造紧张气氛,甚至故意苛求被试做出某些行为。而有些主试因为在现实生活中需要被试或其家人的帮忙,因此会放宽对被试的要求 ,在测验过程中给予特别的关心和照顾。这些都会影响测验结果的客观性。
3. 主试的人格
有些主试比较内向,不太容易与陌生人建立关系,因此,对他而言,在短时间内与被试建立协调关系就比较困难。有些主试的竞争意识很强,在测验实施过程中往往会苛求被试,这样往往会造成被试测验分数较低;而有些主试则非常和气宽容,对评分尺度把握不严,就会使得测验分数较高。
4. 主试的期望
在有些情况下,主试的期望会无意中影响被试的反应,这就是著名的“罗森塔尔效应(RobertRosenthal Effect)”,亦称“皮格马利翁效应(Pygmalion Effect)”或“期望效应”。这种效应在所有标准化测验中都有所发现,例如在智力测验中,要求正在进行智力测验实习的研究生给测验中一些模糊不清的答案评分,随机告诉他们某个反应是“聪明”被试回答的,某个反应是“较笨”被试做出的回答。结果发现,学生们倾向于给“聪明”的被试高分,但事实上,那些“聪明”被试的答案并不比“较笨”被试的答案高明。
罗森塔尔认为这种效应可能源于主试和被试之间的非言语交流。例如在一项使用罗夏测验进行的实验中,共有14名主试,施测前告诉其中7人:有经验的主试引发的人类反应比动物反应多;而告诉另外7人:有经验的主试引发的动物反应比人类反应多。结果,两组主试从其被试中获得了差异显著的动物与人类的反应比例。尽管主试和被试都认为自己并没有意识到有任何影响,对所有测验现场的录音分析也没有找到主试进行言语影响的证据,但差异仍然发生了。因此,主试的期望很可能是通过主试与被试接触时微妙的姿势变化或面部暗示而起作用的。
在标准化的心理测验中,测验与答卷通常是分开的。被试将测验项目的答案直接记录在专用答卷上。另外备有一份标准答案卡,此为记分键,评分时只要将被试的答案逐一与标准答案相比较,即可评定被试应得的分数。
1、记录反应。及时清楚地记录受测者的反应,包括受测者自己的回答和主试对被试反应的记录。主试对受测者的语言反应、操作、动作、表情、情绪等都可做记录。
2、掌握标准答案。标准答案常以计分键的形式表示。从题型上看,选择题的计分键就是选项的序号,简答题的计分键是一系列正确答案以及所允许的变化,论文式试题的计分键为各种可接受的答案的要点。从内容上看,能力测验的计分键常为某个问题的正确答案或最佳答案,人格测验的计分键则指具有或缺少某种人格特征者可能的典型反应。
3、反应与计分键比较。即将受测者的回答进行归类或赋予分数。客观题的程序很明确简单,但问答题、论文题就需对评分的规则做详细说明,评分时将个人的回答与评分标准答案提供的样例进行比较,按最接近的给分。