基于教育测量学的中高考试题改革设想

王旭东

(温州市教育评估院质量评价科, 温州 325000)

摘要: 中高考命题技术要基于教育测量学原理做一些改革。本文针对中高考不同题型试题, 提出七种改革设想, 供命题者研究参考。一是个别选择题变为不定项选择题、增加干扰项数量、实行等级赋分方式; 二是个别填空题采取一空多答案方式; 三是个别计算题的已知条件可以有多余、不同解法可以不同赋分; 四是实验题要加强考查实验方法迁移应用能力、质疑发现能力、探究创新能力 和严谨的科学态度; 五是个别问答题的情景可以包含一些可用可不用的、没用的、甚至错误的信息; 六是作文可以让学生自选题目, 优化评分技术; 七是增设跨学科融合型综合题; 八是增设视频题考查听和观察的能力。 

关键词: 中考命题, 高考命题, 命题技术, 试题研究, 考试评价

DOI: 10.48014/tpcp.20220327001

引用格式: 王旭东. 基于教育测量学的中高考试题改革设想[J]. 中国教育学理论与实践,2022,1 (1):9-15.

文章类型: 研究性论文

收稿日期: 2022-03-27

接收日期: 2022-05-05

出版日期: 2022-06-28

国务院办公厅《关于新时代推进普通高中育人方式改革的指导意见》明确提出:高考命题要“优化考试内容,突出立德树人导向,重点考查学生运用所学知识分析问题和解决问题的能力。创新试题形式,加强情境设计,注重联系社会生活实际,增加综合性、开放性、应用性、探究性试题。”[1]教育部考试中心《中国高考评价体系》确立了高考试题“基础性、综合性、应用型、创新性”[2]考查要求。

教育部《关于加强初中学业水平考试命题工作的意见》明确提出:“初中学业水平考试兼顾学生毕业和升学需要”“省级教育行政部门要结合实际,对各学科考试时长、容量、难度等提出规范要求”“试题命制既要注重考查基础知识、基本技能,还要注重考查思维过程、创新意识和分析问题、解决问题的能力”“结合不同学科特点,合理设置试题结构,减少机械记忆试题和客观性试题比例,提高探究性、开放性、综合性试题比例,积极探索跨学科命题”“充分考虑城乡学生学习和生活实际,增强情境创设的真实性、典型性和适切性,提高试题情境设计水平。”[3]教育部办公厅《关于做好2022年中考命题工作的通知》指出:要根据不同学科特点,合理设置试卷试题结构,减少记忆性试题,增加探究性、开放性、综合性试题。

根据中共中央办公厅、国务院办公厅《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》、教育部办公厅《关于进一步加强学校考试管理的通知》文件精神,做好中考命题工作,对于引导深化义务教育教学改革、促进减负提质、巩固“双减”成果具有重要意义[4]。中考命题要有利于义务教育减负工作,要引导学校和教师不要做应试教育。同样,也适合高考命题改革导向。

这些纲领性文件表明中考高考命题改革有四个共同趋势:一是试题情景要真实化,凸显解决真实问题能力;二是减少客观题和机械性记忆题,加大高阶思维能力考查;三是提高试卷高分学生群体的区分度,有利于科学选拔人才、培养人才;四是提高试题的科学性和专业性,破除应试教育。

教育测量必须具备科学性、公平性、针对性和区分性。科学性是指测量结果具有较高的信度和效度,公平性是指测量内容和方式让所有被测对象都有相同的机会获得好成绩,针对性是指测试内容和问题类型与当前教育教学目标一致,区分性是指能够鉴别被测对象不同的水平程度。通过高考制度来选拔与评价人才,实际上隐含这一种颇有争议的价值判断标准,即“高分=优秀的考生=高素质”[5]

当前中高考试卷普遍具有显著的标准化考试特征,客观性单选题很多,设问指向单一,标准化答案明显,几乎都是纸笔测试。这种过强的标准化考试,选拔出来的高分者未必是高素质者。所以,已经不适合当前教育评价改革,不适合核心素养教育导向。

顺应这四个趋势,基于教育测量学原理,笔者围绕中高考不同题型试题的情景创新、设问创新、赋分方式创新和评分标准创新等方面提出若干设想,供命题者研究参考。

一、选择题创新设想

选择题有单选题、多选题和不定项选择题三种类型。目前来看,大部分地区中考选择题都是单选题,高考试卷中有单选题也有多选题。单选题猜测性很大,特别是考查综合能力较高的单选题的信效度比较低。

多选题和不定项选择题通常有多个选择项是正确答案,学生完全选对则给满分,局部选对给少部分分数,有错选则不给分。学生做答多选题和不定项选择题,只有在十分有把握的情况下会多选,猜测性大大下降。

中高考选择题创新有三:一是少部分选择题改为不定项选择题,加强学生思维全面性、综合性和准确性考查;二是增加选择项数量,减少猜中概率,例如,最后一道稍难的单选题,有些优生学生思考比较久才答对,有些后进生猜蒙正确,削弱了试题信效度;三是优化赋分方式,根据学生思维的深度、广度和准确度分级赋分,提高高分学生群体的区分度。

例1:关于王旭东老师籍贯哪里人,你的最佳答案是哪一个(  )

A浙江省       B江苏省

C杭州市 D温州市

E西湖区 F萧山区

G鹿城区 H洞头区

本题正确答案分别是A浙江省、D温州市和G鹿城区,最佳答案是G鹿城区。如果本题为4分,选A得1分,选D得2分,选G得4分。

二、填空题创新设想

填空题受猜测的影响少,批阅比较方便,评分比较客观;不关注思维过程,关注结果答案,通常采用0、1赋分。中高考的填空题通常侧重基础知识和基本能力考查,平均难度不大。填空题创新设想有如下二种。

1.一空多答案

例2:数据1、3、5、12、a,其中整数a是这组数据的中位数,则该组数据的平均数是    

由于a可以为3、4、5,所以平均数分别为4.8、5、5.2。正确答案有三个,绝大部分学生填写“5”。如果本题满分为4分,填对一个答案则得1分,填对两个答案则得2分,全填对则得4分。

一空多答案,可以有效考查学生思维的全面性、深刻性和自信心。学生解答本题时,获得3个答案,一定会出现自我质疑心理,会再次验算,做自我评估,自信自己思维和运算没有错误的前提下,才会勇敢填写三个答案。如果不自信,就会填1个答案。如此,我们可以把真正优秀的学生筛选出来。

2.大题难题填空化

例3:一列简谐波沿一直线传播,某一时刻直线上相距为d的A、B两点均处于平衡位置,且A、B之间仅有一个波峰。若经过时间t,质点B恰好第一次到达波峰位置。求波速。

解答分析:根据“A、B两点均处于平衡位置,且A、B之间仅有一个波峰”,可能有下列a、b、c、d四种情况,再由于简谐波的方向有两种可能,则有8种情形,具体解法如下。

(1)假设波由A传向B,波向右传播的距离为X,

(a)图:△X=d/2,v=d/2t1分

(b)图:△X=3d/4,v=3d/4t1分

(c)图:△X=d/4,v=d/4t1分

(d)图:△X=d/2,v=d/2t1分

(2)假设波由B传向A,波向右传播的距离为X,

(a)图:△X=3d/2,v=3d/2t1分

(b)图:△X=d/4,v=d/4t1分

(c)图:△X=3d/4,v=3d/4t1分

(d)图:△X=d/6,v=d/6t1分

综合可知:可能波速有5种,分别是d/6t、d/4t、d/2t、3d/4t、3d/2t。2分

该题作为难度较大的计算题,满分值至少10分。学生作答不完整,可以局部得分,因此,对不同层次的考生都有较好的区分度。

如果改编成填空题:该列波的波速大小有   种可能性。学生作答该填空题,一旦思维过程中有一个地方出现漏洞,本题就不能得分。正如现实科研生产工作,只有每一个环节都准确无误才能成功。把一些综合性计算题改编成填空题,更能考查学生思维的全面性、严谨性和完美性,体现严谨完美的工程质量思想。而且,作答采取0、1计分,本题区分对象不再是全体考生,而是高分学生;即对高分学生的选拔具有很大的区分度和信效度。

三、计算题创新设想

目前中高考试卷中的计算题,都存在三个值得商榷的问题:一是题目中“已知条件”不多不少;如果学生解答过程中有一个“已知条件”没有被利用,解答必出错,这也暗示了学生应试解题思维;二是设问指向明确,答案唯一,不利于考查发散性思维;三是不同解法,只要答案正确,都是满分,不在乎解法优劣。计算题创新有下面三个设想。

1.已知条件可以多余

现实生活和科研中,要解决一个问题,存在很多可以利用的资源,其中有些资源没有被用到;有人喜欢用到这几个资源,有人喜欢用到那几个资源,利用不同的资源,解决问题的效益不一样。个别计算题的已知条件可以多一点,更符合现实情景;能够考查学生在复杂的信息背景中快捷筛选出最佳信息的能力,考查学生能否拟用最佳解法解决问题的能力,同时,避免了学生的应试思维。

2.设置开放性设问。

例4:已知两个串联电阻,R1=5Ω,R2两端电压2V,电源电压3V。求你能求的所有电学量?

本题设问具有典型的开放性。根据三个已知条件,可以求解R1两端的电压、流过R1的电流、R1电功率;R2电阻值、流过R2的电流、R2的电功率;串联电路的总电阻、总电流、总电功率。

按常规,本题赋分9分,一个正确答案赋分1分;根据学生求解的电学量的数量和准确性分别给分,可以考查学生的发散性思维的程度。

3.不同解法不同赋分

我国很多大规模教育考试,如高考、高中学业水平考试、中考一些学科的答案和评分标准,多数只是答案,不能称为评分标准[6]。阅卷教师通常看答案给分,只要答案对得上,不管解法优劣,都给同样的满分。

在现实环境中,解决问题的方法不是唯一的;采取不同的解决方法,投入的时间、人力、物力和财力不一样,效益不一样。选择最佳的方法和技术,改进方法和技术,都是科研工作的重要目标。

我们可以命制一题多解的计算题,简便优质的解法得满分,复杂简陋的解法得局部分数,借此区分学生思维品质的高低。虽然这种赋分挑战了传统计算题赋分习惯,但是对教与学都是一个很好的价值导向。

四、实验题创新设想

中高考实验题有两种方式:一种是纸笔测试,侧重实验原理、实验猜想、实验步骤、实验方法、数据计算和实验结果等理论性内容;另一种是现场实验,侧重实践操作、现象观察、方法迁移、综合创新、科学态度等实践性内容。目前,有些省市已经将现场实验考查成绩量化纳入中考。随着中高考命题改革,纸笔实验考查分数要降低,现场实验考查分数要提升。

常规的现场实验测评侧重考查学生的操作步骤、仪器使用能力、测量工具读数能力、现象观察能力等基本实验能力。中高考现场实验创新题要“源于课本,高于课本”,除了考查基本实验能力以外,还要加重考查实验方法应用创新能力、质疑探究发现能力和严谨的科学态度。

例5:教材中实验:一个小灯泡、一根导线、两节干电池;要求学生将小灯泡点亮。侧重考查学生的操作能力和观察能力。

实验创新一:提供一节干电池、一根导线、两个小灯泡。要求学生点亮每个小灯泡。

实验创新二:提供一节干电池、一个电池盒(含两根导线),两个二极管,要求学生点亮两个二极管。

本题来自浙江省小学教育质量综合监测,虽然是小学科学试题,但是其命题思想值得中高考模仿。小学科学课本上原实验提供两节电池,现在改为一节干电池。小灯泡工作电压减半,功率变为原来四分之一,亮度变得很低,就是灯丝一点点亮,在白天或日光灯下,大大增加了观察判断的难度。两个小灯泡中有一个是坏的,优秀学生经过反复试验后会大胆向老师提出“有一个小灯泡是坏的”的结论,更优秀的学生会发现并报告“灯丝断了”,也有学生会说“刚才有一点点亮”想蒙混过关。借此考查学生的严谨科学态度和质疑探究发现能力。

小学生没有接触过二极管,也不懂二极管发光原理,更没有做过这个实验。但是,这个实验的操作技术和方法是“点亮小灯泡实验”的迁移和应用创新。学生要做几次探索式试验,发现正向电压能让二极管发亮,负向电压不能让二极管发亮,更优秀的学生会发现并报告“怎么接是正向电压,怎么接电是反向电压”。借此考查学生的方法迁移能力和探究发现能力,凸显解决真问题能力。

五、问答题创新设想

我们把简答题、说理题、论述题等主观题统称为问答题。问答题试题由素材情景和设问两部分构成,要求学生基于素材情景,结合自己学过的知识,回答相关问题。一般情况下,简答题的设问指向比较明确,论述题具有开放性、个性化特征,考查学生高价思维能力和书面表达能力。

问答题创新在于情景信息复杂性和真实性。现在的问答题,题目中每一个字、每一个数据、每一个符号、每一个图表都是经过反复推敲过的,都是必有用于解题,没有多余的。当今社会是一个信息爆炸的时代,我们接收到的信息量非常巨大,其中大部分信息是无用的,或者可用可不用的,或者错误的。

中高考问答题的素材情景要回归真实和现实,素材背景不要做太多的理想化处理,保留一些真实原貌,也就是说,试题情景文本中包含一些必用信息、可用可不用的信息、没用的信息,甚至错误的信息,考查学生辨析、筛选有效信息的能力。如果含有错误信息,可以考查学生质疑批判能力。

比如,一个论题有正、反两方观点,双方的论证推理的方法也有不严谨的地方,论据的证据都有或多或少的错误。让考生做分析点评,考查学生能否分辨是非,能否做出合理判断,或者形成自己的新观点。

六、作文题创新设想

1.学生自选作文题目

中高考作文大都是全命题、半命题、材料作文和话题作文,全体考生只有一个作文,公正不公平。高考作文内容重视学生个人感悟和理性思辨,阳刚味、议论味稍浓,适合男生一点。大多数中考作文是写人叙事、抒写心情的记叙文,阴柔味、故事味稍浓,适合女生一点。不同考生对话题偏爱不一样,文笔擅长不一样,遇到自己喜欢的话题,作文发挥就有优势;如果遇到自己讨厌的话题,发挥就不如意。

为了让每一个学生都有话好写,命制中高考作文时要充分考虑到不同个体、不同性别、不同区域、不同家庭、不同学校背景的考生的公平性;要让更多的学生遇到自己喜欢的作文题,充分展示自己个性化的写作能力。这样才能体现人文关怀,体现公平,更体现选拔性考试高区分的需求。部分地区中考已经尝试作文“选做题”,得到广大学生和老师的认可。

例6:根据要求作文。小欧班级语文报【话说温州】栏目邀请同学们参加征文比赛,请你以“我眼中的温州”为话题,写一篇参赛文章。

要求:(1)你需要在下列【写作助手】“内容选择”和“文体选择”栏目中个选择一项,填写在相应括号内,再根据你的选择谋篇布局,注意表达得体;(2)自拟题目;(3)不少于600字;(4)不得套写、抄袭;(5)不得透露个人信息。

写作助手

内容选择(任选一项)(▲)

文体选择(任选一项)(▲)

A.温州历史名人(如谢灵运、苏步青、刘基……)

B.温州风景名胜(如楠溪江、廊桥、五码历史文化街区……)

C.温州民俗文化(如温州童谣、细纹刻制、南戏……)

D.温州本土美食(如鸭舌、矾山肉燕、鱼饼……)

A.散文

B.人物传记

C.说明文

D.倡议书

2.加大作文评价的区分度

目前中高考作文评价标准有五个等级,实际批改时,阅卷教师评定很少出现最高级和最低级。又由于批改采取双评机制,更容易导致评分趋中现象。笔者曾经对一个区县中考作文做过数据研究,把所有考生按语文成绩高低均匀分成五等分,五个等第学生作文平均分差不多,几乎没有区分度。地市层面中考作文题平均得分率在0.75左右,区分度在0.15左右,严格地说,区分度低于0.2的试题是不合格试题。

作文区分度过低,主要原因是评价标准和批改质量引起的,而不是学生做答质量均匀。写作是考查学生语文基础知识与积累、语言表达能力和综合创新能力最重要的试题,作为语文考试的大题目理应有很大的区分度。建议中高考作文评价标准设置7个等级,利用大数据技术监控监管阅卷教师的作文批改质量,提高作文的区分度。

3.提高“作文选做题”评价的公正性

不同类作文成绩可以采取等值赋分处理方法,类似浙江和上海等地选考科目赋分技术。另外,对教师作文批改工作做合理化分工。同一个教师对不同文体、不同主题的作文评价标准理解掌握会有差异,评判的能力也有差异,必然会出现评判误差;改卷过程中不同文体的数量差异和出现频次差异,也会给阅卷教师带来偶然性误差。可以利用大数据技术对教师批改任务做合理化分工,不同主题、不同类型的作文分别由不同老师批改,有利于评价标准的掌握和应用。

七、跨学科综合题创新设想

跨学科综合创新能力是未来高精尖人才必须具备的能力。中高考采用跨学科综合题,可以考查学生跨学科知识融合能力和综合应用能力,为高一级学校选拔优秀人才。跨学科综合题要求不同学科知识、学科能力、学科思想深度融合,不能拼盘组合,而且要学科主次分明。

例7:随着全球汽车保有量的急剧增加,燃油汽车尾气排放带来的环境问题也日益严峻,为汽车寻找合适新能源成为各汽车企业重点研究课题。Mirai是某品牌汽车企业首款量产的新型氢燃料电池车,它不是利用氢气燃烧获取能量,而是利用氢气和氧气化学反应中电子转移形成电流获得电能,其燃料电池工作原理如图,燃料电池的部分参数如下表,请回答:

(1)Mirai在环保方面最大的优点是   (写一点即可);

(2)新型氢燃料电池原理中“X”所代表微粒的符号是   ;

(3)Mirai的燃料电池堆栈的体积约为   升(保留两位小数点);

(4)燃料电池以最大功率工作10秒,总共输出多少电能?

Mirai燃料电池部分参数

燃料电池堆栈

主要材料

固体高分子薄膜

最大功率

114千瓦

体积功率密度

3.1千瓦/升

升压器

最大电压

650伏

本题是物理和化学跨学科综合题,(1)(2)问考查化学知识,(3)(4)问考查物理知识。四个问题虽然都基于一个情景,但是物理和化学问题之间互不关联,考查内容之间没有发生内在联系,是一个典型拼盘组合式综合题。拼盘组合式跨学科试题不能有效考查学生跨学科综合能力。

例8:氢是一种洁净能源,燃烧值为1.43×108焦/千克。地球上的氢多以化合态(主要是水)形式存在。在开发氢能源时,若用电解水的方法获得氢气(在20千伏、500安下,24小时可电解水9吨),问此法是否有价值?[7]

先求得电解9吨水需要消耗电能W=UIt=8.64×1011焦,由2H2O=2H2↑+O2↑计算电解出氢气的质量为1000千克,再计算1000千克氢气燃烧释放出的热量Q=mq=1.43×1011焦,因为W>Q,所以这种方法没有价值。

本题是物理和化学跨学科深度融合的跨学科综合题,以物理为主、化学为辅。学生只有全面正确掌握物理和化学相关知识,才能作答正确,有一个考点不到位,就会解题失败。这种深度融合的跨学科综合题才符合中高考命题改革的精神。

八、视频题创新设想

听和看(观察)是人类最基本、最重要的学习技能,是获取信息最重要的能力,其中,观察能力是科学实验和科学研究的最基本的能力之一。除了英语,现在没有学科考查学生的听力和观察力。视频题是一种表现性评价,能考查纸笔测试难以考查的能力。相比试卷上图文信息,视频信息量不仅仅丰富,而且是瞬间的、动态的,贴近真实科研和交流情景。

先让学生看一段视频,要求学生复述视频内容,并追问几个问题让学生回答。把学生的复述内容和回答结果与视频素材做对照,重点考查学生是能否准确、完整、择优获取视频信息的内容,评价其吻合性[8]。数学视频题侧重考查学生对数字、数据、图表信息的敏感性和记忆性以及准确性和匹配性。物理、化学、生物学科侧重考查科学观察能力,让学生看视频中真实物品、模型模具、动物植物、自然和实验现象等,考查学生观察的全面性、细致性、准确性、敏锐性。政治、历史、地理学科侧重考查学生在复杂信息背景中对不同人物、不同观点及其证据等信息的筛选获取、辨析判断、分析评价的能力。

通过中高考命题题型创新、情景创新、设问创新、赋分方式创新和评分标准创新,削弱中高考标准化考试属性,引领一线教师由“知识立意”“应试教育”“习题教育”转向“解决真实问题能力”“实践操作能力”“创新能力”和“情感态度价值观”教育,引领学校教育教学指向“中国学生核心素养”和“关键能力”。中高考命题改革要发挥积极的正向导向作用,通过“以考促教、以考促学”优化育人方式,破除应试教学,实现“立德树人、服务选才,引导教学”目的。

利益冲突: 作者声明无利益冲突。


[②] *通讯作者 Corresponding author:王旭东387608256@qq.com
收稿日期:2022-03-27; 录用日期:2022-05-05; 发表日期:2022-06-28

参考文献(References)

[1] 国务院办公厅.关于新时代推进普通高中育人方式改革 的指导意见[EB/OL]//
http://www.gov.cn/zhengce/ content/2019-06/19/content_5401568.htm.
[2] 教育部考试中心.中国高考评价体系[M].北京:人民教 育出版社,2019.
[3] 教育部.关于加强初中学业水平考试命题工作的意见 [EB/OL]//
http://www.moe.gov.cn/srcsite/A06/ s3321/201911/t20191128_409951.html.
[4] 教育部办公厅.关于做好2022年中考命题工作的通知 [EB/OL]//
http://www.moe.gov.cn/srcsite/A06/ s3321/202204/t20220406_614237.html.
[5] 黄光扬.教育测量与评价[M].上海:华东师范大学出版 社,2005.
[6] 雷新用.基于标准的教育考试-命题、标准设置和学业评 价[M].上海:上海科学技术出版社,2011.
[7] 杨元俊.跨学科综合题归类与分析[J].理科考生研究 (物理版),2001(1):36-38.
[8] 王旭东.小学表现性评价的行为分类及其评价要点[J]. 教学与管理,2020(7):70-72. 14 中国教育学理论与实践 Theory and Practice of Chinese Pedagogy

Proposals on Reform of Test Questions of Senior High School Entrance Examination and National College Entrance Examination Based on Educational Measurement

WANG Xudong

(Division of Quality Evaluation, Wenzhou Educational Evaluation Institute, Wenzhou 325000, China)

Abstract: Question setting technology of senior high school entrance examination and national college entrance examination awaits some reform. on the basis of educational measurement principles. Following are seven proposals on such reform. for respective question types in the two examinations, for the reference of question originators. Firstly, the number of the correct choice(s) for choice questions can be made uncertain, disturbance options can be added, and point assigning can be conducted in accordance with different ratings. Secondly, multiple answers can be provided for certain blank-filling questions. Thirdly, redundant known conditions can be given for calculating questions, and points may be made respectively for different solutions. Fourthly, experiment questions shall attach greater importance to examining students’ abilities of assimilating and applying experimental methods, of questioning and detecting, and of exploring and innovating, as well as the rigorousness of their scientific attitude. Fifthly, some unnecessary, useless and even false information can be offered for question-and-answer questions. Sixth, self-selected topics can be set for composition writing, and assessing technology shall be optimized. Seventh, integrated interdisciplinary questions can be taken into the test. Eighth, audio questions can be added to test students’ hearing and observing abilities.  

Keywords: Question setting of senior high school entrance examination, question setting of national college entrance examination, question setting technology, research on test questions, examination assessment

DOI: 10.48014/tpcp.20220327001

Citation: WANG Xudong.Proposals on reform of test questions of senior high school entrance examination and national college entrance examination based on educational measurement[J].Theory and Practice of Chinese Pedagogy,2022,1(1):9-15.