学校名称
您目前的位置:教师发展-ssy>校本培训-市实验>正文

命 题 方 法 与 试 卷 分析

发表时间:2015-01-05 阅读次数:2558
命 题 方 法 与 试 卷 分析
青岛市普通教育教研室  刘林
 
对命题而言,经验固然重要,还是有科学方法可循的。试卷质量的高低,能否达到其检测的目的,对教与学质量的提高是至关重要的。我从以下四个方面与老师们交流考前命题和考后试卷分析的方法:
一、教育测量简介
二、命制试卷的一般流程
三、试卷质量的基本分析
四、试卷分析报告的基本模式
 
一、教育测量简介
由于使用目的与需求的不同,有多种分类。我们侧重于学生在学校接受学科学习与训练后,对学生所获得知识、技能与能力状况进行考核,并将考核结果转化为数量描述的过程。按照解释测量分数的参照体系的不同,教育测量可以分为常模参照测量标准参照测量两种。
1.常模参照测量  
参照某个特定群体分数的常模来解释个体测验分数在团体中所处相对位置的测验称为常模参照测验。
常见的是“标准分数常模”,标准分数与测验分数(原始分数)的转换公式为:
其中,X是某一测验分数(某生), 是常模样组(全班)的测验分数的平均数(全班的平均分),S是常模样组(全班)的测验分数的标准差(表示考生分数的分散程度, ),Z就是相应测验分数的标准分数(Z分数)。不论什么测验,测验分数(原始分数)转化为标准分数(Z分数)后,其平均值均为0,标准差均为1。实际应用中,标准分数(Z分数)可能出现负值和小数,容易引起误解。因此,在具体使用时,往往对标准分数(Z分数)进行线性变换,如:90年代末期的我省的高考曾使用T=100Z+500来公布考生的高考单科成绩与总分成绩。
常模参考测验的目的旨在区别不同考生间的不同成绩水平,并给参加测验的考生评定学业成就等级。一般的,学校使用的学期测验、模拟测验、学科竞赛,以及多数与就业或升学选拔有关的测验(如联考、高考等),都属于常模参照测验。
2.标准参照测验
标准参照测验是指参考国家的课程标准或学校与教师在教学前制订的标准来解释个别测验分数是否达到这项既定标准的一种测验。
标准参照测验的目的是了解学生已经学会了什么,是否达到某一阶段学校或教师所期望的成就水准,而不是将学生与他人进行比较。通常,学校中的平时小考、课堂测验、单元检测、学科结业考试、毕业考试、高中会考等,都属于标准参照测验。也称通过性考试,如:职称晋升的计算机考试、驾照的科目1考试等等。
二、命制试卷的一般流程
1.明确测量的目的。确定测验的类型,属于常模参考还是标准参照。
2.编制双向细目表。确定整份试卷的难易度、能力要求(了解、知道、理解、掌握)、考查范围、知识点。题型(选择、判断、填空、作图、简答、计算等等)、题量、分值、每题难度等等。
3.编制试题。
4.组卷。
5.编制参考解答与评分标准。
三、试卷质量的基本分析
对常模参照性考试,常用的评价试卷质量的测量学指标有:信度、效度、难度和区分度。
(一)信度
信度是指测量结果的稳定性或可靠的程度,即测验得到的结果(实测分数)与考生实际水平(真分数)间的一致性程度。
学校自己命制的期中、期末数学试卷,信度在0.6以上即可认为考试信度比较好。
(二)效度
效度就是测验测到计划要测的东西的程度,是测验中最重要的质量指标。
一般认为,效度在0.3以上的试卷就为良好的。
(三)难度(通过率)
1.客观题难度的计算:
其中,p表示题目的难度系数, n表示参加测验的总人数,r表示答对该题目的人数。可见,难度系数越大,题目越容易;难度系数越小,题目越难。
2.主观题难度的计算:
其中, 是全体考生在该题上的平均得分, 为该题的满分。
3.用极端分组法计算难度:
当考生人数较多时,无论是主观题还是客观题,都可以采用极端分组法计算试题的难度,计算步骤如下:
(1)先按照测验总分,由高到低将考生成绩依次排序;
(2)选出前27%的成绩作为高分组,计算出高分组对应的题目难度 ;
(3)选出后27%的成绩作为低分组,计算出低分组对应的题目难度 ;
(4)该题的难度取 和 的平均分,即 。
难度系数的取值范围为: 。
4.一般认为,难度系数 为容易题,
难度系数 为中等难度,
难度系数 为难题。当p=0.5时,区分度最好。
从单个试题看,主观题(如计算题、作图、证明等等)试题难度系数在0.5左右最为合适。
客观题由于存在随机猜测答对的影响,“四选一”选择题的适宜难度系数为0.7左右。
是非题的适宜难度系数为0.85左右。
从整卷看,若测验中试题间的相关性很高(知识点少,如单元检测),则试卷中题目的难度系数分布应宽一些,可在p=0.01—0.99全距间作均匀分布。若测验中试题间的相关性很低(如:学期期末考试),可以围绕p=0.5形成窄全距分布。
5.一般情况下,标准化样本组所构成的测验分数分布呈正态分布;如果题目太难,频数集中于分布的左侧,呈现出正偏态;如果题目太易,频数集中于分布的右侧,呈现负偏态。我们理想的试题应当是呈正态分布的。

正态分布曲线
正偏态曲线
负偏态曲线

(四)区分度
试题区分度是指测验试题鉴别考生实际能力水平高低的量度。
区分度是编制常模参照性测验中筛选题目的重要指标,我们应当重点研究。
一般的,各题的区分度都较高时,测验的信度和效度也会提高。
1.区分度的估计方法
方法一:高低端分组法。简便,但精确度不够。将考生按题目的得分高低进行排序,然后取出高分组段,题目得分的前27%,算出高分组段的得分率,记为 ;低分组段,题目得分的后27%,算出低分组段的得分率,记为 ,用公式表示区分度为: 。
方法二:相关法(点二列相关系数)。对二分变量计分的题目适用,即客观题常用,较准确。区分度为:
,( )
其中,p为回答正确的考生占全体考生的比率,q表示回答错误的考生占全体考生的比率, 为该题回答正确的考生总分的平均分, 为该题回答错误的考生总分的平均分, 为总分的标准差。
相关法(积差相关系数),适用于题目得分是连续变化的情况,即主观题。可用以下公式表示区分度:
,( )
其中, 表示该题第i个考生的该题得分, 表示第i个考生的总分, 表示该题的平均分, 表示考试总分的平均分,n为考生数。实际上,就是该题与总分的相关性有多少。
一般认为, 的试题质量优秀, 的试题质量良好, 的试题质量尚可,但需要修改, 的试题质量差,需要淘汰。
应当注意:当某题的难度系数为0.5左右时,该题的区分度是最好的。这是我们命题时需要考虑到的。
四、试卷分析报告的基本模式
目的:全面认识测验的效果,正确解释测验成绩传达的信息,指导教师更有效的开展教学,帮助学生更好的进入下一阶段的学习。
形式:根据撰写人的不同,分为学生测验后反思、教师测验后分析、专业人员测验后系统分析等三种形式。据测验性质与规模的不同,分为单元测验分析、学期测验分析、大规模考试(联考与统考等)分析。无论哪种形式,都需要从定性和定量两个角度展开,并综合运动各种统计量表、统计图表等对测验结果进行统计分析。