当前位置:课程学习>>第七章>>文本学习>>知识点二
编制一个新的测验,要做很多的准备工作,正如前面的内容所涉及到的明确测验对象的相关状况、所编制测验的性质和目的等一系列的任务。如果之前讲的内容都是在为编制一个测验做好铺垫,那么在这一单元中测题的编写就进入我们编制测验的正题。编制测验题目是心理测验编制过程中最重要的一环,它是一个从写出、编辑,到预试、修改的一个循环过程。通常,为了得到一套令人满意的测验,要不断的重复这些过程。
拟定好了测验计划之后,我们要做的是大量、全面的搜集有关的资料,以此作为命题取材的依据,要知道一个测验最后在应用的过程中是否能有效的测量出所需要的心理品质和特点,与测验材料的选择恰当与否有非常密切的关系。一般情况下,测验题目的来源主要有三个方面:
(一) 已出版的标准测验:比如编制明尼苏达多项人格(MMPI)测验的简本,就是从MMPI完整测验中精选出168个题目编成简本。若是成就测验,题目可来源于所测量的学科的材料,如课本、参考书、讲义和课题讨论等素材。从已经出版的标准测验中获得测题是一种最简单、最直接的方法。
(二) 理论和专家的经验:已有理论和专家的经验有时也可以作为测题的来源之一,例如要编制态度量表,那么理论上不少对态度的类型、性质维度和定义等等的描述就可以转换成题目。
(三) 临床观察和记录:临床观察是测验题目的又一个来源,各种有效的观察记录表或核检表很多都是源于观察到的行为表现,对于人格测验而言,其题目就是临床上描述人格的术语或是词汇。如明尼苏达多项人格的题目就是从病例记录筛选出来的。
以上就是搜集资料的几个来源,由于资料的搜集关乎测验的好坏,因此搜集资料时应注意几个问题。首先,保证材料的丰富性。资料收集的越是齐全,命题的工作也就更加顺利,而且这样测验内容也不至于偏颇,而且还能有利于提高样本的代表性。其次,材料的普遍性。即选择的材料是整个受试群体都熟知的,只有从这样的材料中得到的测题对所有被试都是公平的。譬如在编制标准化的学科成绩测验时,要统一的教学大纲和统编的教材作为题目的来源,不能只考虑个别教师的意见,而要考虑大多数老师和专家的意见。
编制一个测验时,由于测验题目的类型繁多、功能也各有不同如果要详细的说明每一种题目的具体编制方法是很困难的,但是编制测验题目的一般原则还是有的。我们可以从内容、文字、理解和社会敏感性四个方面来考虑。
(一)内容方面
1.内容符合测验目的:编制测题时内容要切合测验要达到的目标,一般在最初编题时题目的数量要尽量多,保证是最后正式测验保留项目数的两倍左右。但这并不意味着我们要为求数量而乱出题目。
2.内容取样具有代表性:依据所拟定的编制测验计划,选择符合测验计划的内容,而且涉及的不同内容的比例要适当。不可出现一边倒,或是头重脚轻的现象,如果测题内容缺乏代表性最终将影响整个测验的内容效度。确保每一个项目都基于一个重要的学习目标或者主题,项目应该围绕一核心的观念或者问题,不要测量细微的或者周边的信息或技能。
3.题目间内容相互独立:即编制的测题之间要做到互不牵连,如果一个题目的答案影响对另一个题目的回答,测验将得不到被试真实的状况或者信息。因此,测验的开发者需要检查每一个项目,确保在测验的其他地方没有某个项目的正确答案的提示。
(二)文字方面
编制测题的过程中,在文字方面要注意以下几个问题:
1.用语准确:阐述一道题目所用的语言要尽量准确,避免使用生僻的字词或是语句。例如,要编制一个新的测验用于测量我国小学生自主学习能力,出一道题目为“请阐述一下你的…”,低年级的学生可能多半不能理解什么叫“阐述”,因此在这种情况下鉴于被试理解能力和词汇掌握量有限,不宜在测题出现较难词汇。2.语句简明扼要:用语准确的同时,要保证表达语句的简洁利落,避免繁琐重复,在排除与答案无关的因素的同时又要具有答题时的所依据的必要条件。即每一个项目都要用清楚直接,精确的词汇、简单的句子结构以及正确的语法和标点。
3.概念表达:最好是用一句话就能说明一个概念,不要使用两个或是两个以上的概念,意义必须明确,不允许有暧昧或是含糊不清的状况,另外要尽量少使用双重否定句。编制测题用最直接而又简洁的表达能确保受试者明白,并且不会产生歧义。必要的时候的可以找该领域的专家对项目进行检查,以减少不准确。那种有多种解释和可能的问题应该改写或弃之不用。
(三)理解方面
1.题目要有确切的答案:测验编制的题目都应具有确定的答案,备选答案之中不应当有交集。当然,创造力测验和人格测验因为所测目标的特殊性另当别论之外,其他测验不应具有引起争议的可能。
2.题目的内容不要超出受测团体的知识水平和理解能力,这也是很重要的一个问题。就如同一次考试,出的试题不应该超出平时所学的范围,或是高于被试的所及的水准出题,这都不能准确的测量出被试的真实水平。
3.题目的格式不要被人误解。
(四)社会敏感性
在编制测题时,应尽量避开社会敏感性的问题(如性问题、自杀等),如涉及社会禁忌或个人隐私的题目不应使用。因为被试对这些问题做出一个真实确切的回答可能是很容易的,但是问题在于被试考虑到自己真实的回答,可能会引起他人的非议或是暴露自己的隐私,甚至是引起不必要的麻烦,因此会选择虚假作答。所以要在编制测题时要尽量避开此类社会敏感性题目的使用。当有些测验无法避免某些社会敏性问题时,就必须要考虑如何让被试做出真实的回答。
菲利普(Philips,D.L.)就怎样鼓励被试作出真实回答,列举了几个的方法值得参考:
① 命题是假定被试具有某中行为,使他不得不在确实没有该行为时才否定,可避免否定答案过多的倾向。如:“下面哪种情况会使你想过要自杀?失恋?失业?遭受了巨大的失败?从没想过自杀?”
② 命题时假定规范不一致,如“有人认为只有上大学才可以改变命运,而另一些人认为还有其他很多改变命运的途径,你认为呢”
③ 指出该行为虽然是违规的,但是常见的 。 譬如,“大多数人在遭受了巨大的创伤的时候,产生过自杀的念头,你呢?”
编制测验的过程中,可以用于对心理测验的题目分类的标准有很多。鲍勃海姆(Popham)曾经将项目格式分成两种主要类型:要求被试选择的和要求被试回答的,也有人称之为选择型(selection)和提供型(supply)的题目,这两种类型的最大区别在于前者提供备选答案,而后者则是被试根据要求自己写出答案。一般说来,同样的测验内容,采取前一种类型时测题的难度较低。前者常用的形式有判断题、选择题、句子匹配,尤其是前两者最为常用,由于这三种的主观性较小,由此常称为客观项目。后者常用的形式有简答法、论述法等。下面我们将针对不同类型的题目,具体讲解其编制的要领以及要注意的问题。
(一)选择题:
纵观各种测试的内容,选择题是再熟悉不过的一种类型了。它由两部分构成,题干(stem)和选项(opitions/alternatives)。题干就是呈现一个问题的情景,一般由直接问句或不完全的陈述句构成。选项就是问题的多种可能答案,常常是包含一个正确答案的,若干(一般是1-5个)错误答案,其中错误的答案叫“诱答“,是为了迷惑那些无法确定答案的被试。如:
美国的阿拉斯加是向那个国家买来的?( )
A.俄国 B.英国 C.法国 D.加拿大
从上面的例子,可以看出选择题就是由一个“题干”和几个“题肢”组成,“题干”可以是直接问句或不完全叙述句,而“题肢”则是供考生选择的几个真假不明的答案。其格式一般是要求被试把代表正确答案的字母填答在题干的括号里,其优点在于,可适用于各种不同层次学习结果的考试,可降低考生猜测率;学生作答和教师评阅简便,记分客观。 当然,选择题在具有优点的同时也有自身的缺陷,比如命题较困难(因为答案和题目要有逻辑性或似真性),编题费时很多;易受暗示影响。因此,编制过程中要注意以下几个问题:
① 题干所提的问题必须明确,尽量使用简单而且明晰的词语。题干的意义要完整,即便可能正式的测验过程中,被试并不能完全看完选项,或者看完了也未必理解。另外,不要在题干中夹有选项,或者出现不切题的内容。
② 选项切忌过长,要简明扼要。选项中共同的词语,要么把它放到题干中,要么就删去这样可以减少被试看题的时间。
③ 每题只给一个正确答案,其他属诱答。
④ 各选项长度应相等,尽量不要有长有短。选项与题干的联系要非常的密切,诱答也必须一致,以免因差距过大被试很容易就排除了错误答案。
⑤ 避免题干用词与选项用词一致,否则成了选择答案的线索。另外,一些过于绝对的修饰词也不适宜出现在选项中。
⑥ 选项最好用同一形式。如同是日期,同是物理现象等。选项的排列最好随机,不要有规律可循,除非本身就有逻辑顺序。
(二)是非题:
是非题又叫正误题,是指出一个论点要被试判断是否正确,或是从是非两个答案做出选择,因此可以看成有两个备选答案的选择题。是非题也是测验中十分常见的一种类型,也是最容易编制的测验题型之一,但也可能是受到专业测验者批评最多的题型,它提供一个陈述性句子,要求学生做出是非判断。它的格式一般是,“在下列句子中,请在你认为正确的句子后面的括号内画“√”,错的后面画“×”。如:
长江是我国第一大河流。 □对 □错
同样是非题也有其优点和缺点,它的优点在于易编制,适用于各种课程与教材;记分客观,取样范围广泛。但是,是非题不适合策略较高层次的学习结果。它们过于关注细节或者逐字从课文中挑选句子编制题目。因此,人们认为是非题鼓励机械记忆,从而误导学生的学习。另外,还有的批评认为是非题受猜测的影响很大。
尽管是非题存在缺点,但是伊伯(1979)非常支持是非题,他认为“学生成功的判断与知识有关命题的正确或是错误,表示了学生对某一知识领域的掌握程度”,按照他的观点这些命题将成为言语知识的表达方式,而这正是教育成就的实质。以下是编好是非题应注意的几个问题:
① 内容应以有意义的概念、事实或基本原则为基础,不要在叙述中出现琐碎的细节或无关的话语,不要抄袭原文。
② 每道题只能包含一个概念,避免两个或两个以上的概念出现在同一个题目中,造成“半对半错”或“似是而非”的情况。每个试题,应只包括一个主题,且题目必须是完全肯定或完全否定的,避免可是可非或半是半非的叙述;避免使用具有暗示性的特殊限定词,如,“全都”、“总是”、“从不”、“通常”、“有时”等,考生常常利用这些词猜测答案。
③ 尽量避免否定的叙述,尤其是双重否定的叙述。
④ 若是表达意见的题目,最好说明意见的来源和根据,以便测出被试是否了解某个人的意见、信念或价值观念等。
⑤ “是”、“非”题的数目应有适应比例,基本相等,且要随机排列。
(三)简答题
简答题和填空题一样都是代表一种补充型的任务,在客观测验中,只有简答题是提供型的题目,他要求被试用一个正确的词或者句子来完成或填充一个未完成的空白,或者提供一个正确的答案。就记忆的测量角度而言,简答法属于“回忆法”,而前面的三种类型均属于“再认法”,因此同样的考核内容,简答法的难度要高于前面的三种题型的难度。简答法有两种陈述方式,一是用直接疑问句,一是用不完全陈述句,由被试在题目的空白处境写答案,后一种我们通常称为填充题。如:
A.谁是红楼梦的作者? ( ) (直接疑问式简答题)
B.红搂梦的作者是( ) (不完全陈述式简答题,即填充题)
简答题也是最容易编制的题型之一,要求受测者提供正确的答案。因此简答题有如下优点:① 简答题的编写相对比较简单、灵活,不易受猜测的影响;② 简答题可以测量有关术语的知识、特定事实的知识、原则的知识、方法和程序的知识等各种层次的知识目标,也可以测量解决问题的能力,解决数字计算、使用数学符号的技能,解方程或平衡化学方程式等的能力。简答题因能测量多种认知目标,所以应用较为广泛;③ 简答题在各类题型中是最易于编制的一种,不用考虑选项之间的同质性等问题。简答题的缺点是:简答题不适合测量复杂的教育目标,并且由于简答题可能存在一个以上的正确答案,评分并不是完全客观的。它要求被试对问题用几个字或几句话来回答。以下是编制简答题应遵循的几个原则:
①一个简答题只能有一个答案,并且答案必须简短而具体。若是填充题,则必须能用一个词、词组或短语来回答,否则不适宜于编制填充题;
② 不应以简答题来测量零散、琐碎的知识,要尽量用简答题测量重要概念;
③ 除非语法测验或为某种特殊目的进行的语文测验,否则不宜省略连词、介词、冠词等让学生填写,只能从题目中省去有重要意义的词让学生填写;
④ 填充题的空格不宜过多,不应因留下空格而丧失题意的完整性;
⑤ 在试题中避免提供正确答案的线索;
⑥ 如果答案是数字,最好应指明要求的精确度以及单位名称;
⑦ 不宜直接从数科书或其他参考书上原文抄写试题。
(四)操作题:
纸笔测验是所有测验类型中最有效和最客观的,但是关于个体做某事或者制造某物的能力,它们通常只能提供间接的信息。操作题是介于一般认知结果的纸笔测验和在未来真实情景的实际活动之间的测验,是让被试实际操作,如:画图、走迷津、拼配物体等,可以作为纸笔测验题的补充。通过论述测验、选择题测验或其他的书面检测的方法,在较短的时间内可以相当彻底的了解受测者对学科知识的理解。了解某一主题的大量信息,或者能够解释如何做某事,和在实际情景中运用技能是有所区别的。例如,学生在课堂上或者是纸笔测验中能说出正确的答案,但是面临实际的情景,他们却不知所措。课堂中的许多学习都和非技术背景中的行为有相关。要测量一个人一项特殊的技能学的怎么样,虽然不是一定要遵循动作技能目标分类法,但是编制一张详细的行为清单很有用。编制操作测验也有其一般性原则:
① 明确所要测量的目标,并将其操作化。进行工作分析,辨认出操作中最重要的特殊活动,找出具有代表性的工作样本:还要建立作业标准,指出通过此项作业的最低标准。
② 尽量选择真实性较高的题目。操作题编制过程中,要尽量选择真实性较高的项目。但是如果客观条件有限制,比如时间、成本、设备实现和计分可能性较低,也可以考虑采用真实性较低的操作测验,有些工作在操作前需要进行纸笔测验。
③ 指导语要简明扼要,主要让被试明白要他们做什么和在什么条件下做,如使用什么工具、时间限制和评价的依据等。这是任何一种测验题目编制过程中的要求,只有以最简洁明了的语句在短时间内让受试者明白具体的操作过程,施测过程才能顺利进行。
④ 制定评分标准,确定记分方法。有些操作项目可根据完成数量和错误次数客观计分,有些项目的评分就较为困难。在后一种情况下,事先要向被试说明评分的标准,最好把整个操作分解成许多的部分技能,并分别给出评分的标准。
除了以上介绍的几种题目的编制,心理测验的题目种类还有许多种,而且分类方法不同,测验种类也不同,以上只是最常见的几个类型。还有论述法、排列法、联想法、改错法、图解法、划消法、类推法,以及操作测验法等,这里就不逐一介绍了。