当前位置:课程学习>>第八章>>知识讲解>>文本学习>>知识点二

第八章  教育测验的类型与质量分析



知识点二:教育测验项目的难度与区分度


一、测验项目的难度

(一)界定

难度是指测验项目的难易程度,通常用答对该项目的人数比例来表示。一道试题,如果大部分被试都能答对,则该题的难度较小;如果大部分被试都不能答对,则该题的难度大。难度分析的主要目的是为了筛选项目,项目的难度多高合适,取决于测验的目的、性质以及项目的形式。

(二)表示方法

难度用P表示,试题类型不同,计算方法不同。P值越大,其难度越小;P值越小,其难度越大。

对于采用二分法记分的客观性试题,难度用通过率来表示:

主观试题难度的计算:

式中,P为项目难度,R为答对该项目人数,N为被试的人数,W为该题满分分数,  道题的平均分。

(三)测验难度水平的确定

测验题目难度水平的确定,取决于测验的目的、性质和题目的形成。如果测验是为了了解被试在某方面知识技能的掌握情况,而不过多考虑难度高低,只要认为是重要的内容就可以选用。但如果测验目的是为了选拔,测验的平均难度就应该和选拔率大致相同。测验的难度直接影响测验分数的分布形态,影响测验的区分度。一般情况下,测验的平均难度应保持在0.5左右(难度不能直接求平均数,不能进行加减运算),并且各项目间应有一个合理的难度梯度,如最难试题占5%,较难试题占15%,中等试题占60%,较易试题占15%,最易试题占5%。当P值接近于0.5时,题目把被试做最大程度的区分。

影响测验项目难度的因素很多,如学生对试题类型与内容的熟悉程度、题目包含信息量的多少、题目结构的复杂程度、题目的变化动态等。在实践中要合理把握。

(四)标准难度值转换

难度是一个等级变量,不能进行加减运算,如果要求试题的平均难度,需要将难度值进行转换:D=4Z+13(D为标准难度值,Z为与未通过率相对应的正态分布曲线的Z值,

从当p(p:通过率,q:未通过率,p+q=1)大于0.5时, Z小于0,D小于13;p=0.5时,D=13;p小于0.5时,D大于13。D值越大,试题越难;D越小,试题越容易。

二、测验项目的区分度

(一)界定

项目区分度是指测验题目对学业水平不同的考生的区分程度或鉴别能力,即通过测试考出学生的不同水平,把优秀学生、一般学生和困难学生区别开来。区分度是测验质量的一个重要指标,说明的是试题对于测验目的来说的有效性程度。区分度高的项目,能将不同水平的被试区分开来。如果一个项目,实际水平高的被试能顺利通过,而实际水平低的被试不能通过,该项目就具有较高的区分度。

(二)计算方法

1.相关系数法

项目区分度一般由被试在某项目的得分与实际能力水平(一般用测验总分表示)之间的相关系数来表示,相关程度越高,该项目区分度就越高。由于测验总分属于连续变量,根据项目的得分属于二分变量或连续的,估计区分度时可选用点二列相关系数(主要用于客观性试题区分度的分析)和积差相关系数(主要用于主观性试题区分度的分析)方法。

2.高低分组表示法

根据总成绩排序,前27%的被试为高分组,后27%的被试为低分组。区分度表示方法为:客观试题为

。主观性试题为:

式中,D为区分度,PH和PL分别表示高分组和低分组试题的通过率;XH和XL分别表示高、低分组的总得分,N表示考生总人数,H表示该题的最高得分,L表示该题的最低得分。

如在100名考生中,高分组27人,其中20人答对某道选择题,低分组27人,其中5人答对该题,则该试题的区分度为:PH=20÷27=0.74;PL=5÷27=0.19;D=0.74-0.19=0.55。

D值是反映项目作答情况与总分高低之间关系的量数。通常情况下,测验要求试题的区分度在0.30以上,;区分度在0.40以上为优秀,表示试题能起到很好的区分作用。1965年美国测验专家伊贝尔根据长期的经验,提出用鉴别指数评价项目性能的标准。

区分数指数(D)

评价

0.40以上

非常良好

0.3—0.39

良好,修改后会更佳

0.2—0.29

尚可,但需修改

0.19以下

必须淘汰

(三)区分度与难度之间的关系

区分度与难度之间关系密切。项目难度影响项目得分的标准差,并将直接影响项目区分度的大小。当题目难度水平接近或等于0.5时,项目标准差为最大值,这说明项目在中等难度时,分数变异最大,它提供的被试差异的信息最多,所以题目的区分度最大。

编拟测验时,要求各项难度适当分散,特别难和特别容易的项目少些,接近中等难度的项目多些,使所有项目的平均难度接近0.5,并形成一个合理的难度梯度分布。这样不仅能保证多数项目具有较高的区分度,而且可以保证整个测验对被试具有较高的区分能力。学校里日常的学科测验一般对区分度没有特别要求。

 

进入知识点三的学习