第二节 物理学业成就的评价
学生学业成就的评价是指根据一定的标准,对学生的物理学习过程和结果进行价值判断的活动,即测定或诊断学生是否达到物理教学目标及其达到目标的程度。因此它是物理教学评价的主要内容,也是评价教学是否有效的重要指标。
一.对学生学业成就评价的基本理念和目标
1.评价的基本理念
(1)学生的学习评价旨在促进学生的发展
物理学习评价既要关注学生对物理知识的理解能力、推理能力和技能掌握的水平和程度,又要关注对过程和方法的理解,更要重视对学生科学情感、态度、价值观形成的评价,而不能把评价的注意力放在评价的鉴别与选拔的功能上。
(2)既要评价成绩又要评价学生参与学习的机会
评价学生的学业成就不是检查学生记住了多少信息,而是要了解学生对知识的理解、推理和应用,因此对学生学业成就评价的重点要集中在对学生来说最重要的科学内容和具有良好结构的知识上。同时也要对学生参与学习机会进行评价。要重视对学生在活动、实验、制作、讨论等方面表现的评价。
(3)倡导过程评价,淡化等级评价
评价和学习是一个事物的两个方面。评价的最主要功能是为教师的教和学生的学提供反馈信息。而学生学习效果的信息也只有通过关注学生的学习过程才能获得。
(4)重视自我评价
自我评价的能力是自我反思学习的重要工具,学生通过反思,明确了他们应学习些什么,就会开始把学习物理的外部期望转化为内在的动力。让学生经常参与下列评价活动,可以提高学生自我评价的能力。
第一,选择一份自己的探究作业来证明其对物理概念、原理或定律的理解或者是进行科学探究的能力。
第二,以口头、书面或图解的方式解释如何利用一份作业标本来证明自己的理解力。
第三,根据教师制定的标准和要求来评判自己的一份作业标本。
第四,对其他同学的作业提出建设性的批评意见。
(5)突出真实性评价
真实性评价要求评价活动要尽可能接近物理教育的预期效果,同时要求学生把掌握的物理知识和推理能力运用于与现实世界中可能遇到的情况和科学家实际工作的情况很相似的情景。
2.评价的目的
学生学习评价的目的是甄别、判断和促进学生在知识与技能,过程与方法,情感态度与价值观方面的发展,发现学生多方面的潜能,了解学生发展中的需求,使每一个学生通过评价都能看到自己在发展中的长处,增强学习的信心。评价应全面客观地反映教学的真实情况,为改进教学提供真实可靠的依据。
二.评价的内容和方法
1.评价内容
(1)对科学探究过程的评价
科学探究的重要目标是体验科学过程,形成科学探究能力,增进对科学探究的理解。要理解探究和进行探究取决于学生对物理概念、原理、定律和理论的了解,探究还需要推理能力和基本实验技能。具体评价的内容包括:提出问题、进行猜想和假设、制订计划、设计实验、观察与实验、获取事实与证据、检验与评价、表达与交流等六个方面。但对于每一个具体的科学探究活动,可以有重点地选择其中几项,有针对性地制定评价标准。
(2)对物理知识与技能的评价
对物理知识与技能的评价,主要是学生对物理知识的理解力。这种理解力需要学生对物理概念、原理、定律和理论的了解,需要运用知识进行推理的能力。因为没有交流,就不可能辨别学生学到些什么和学生如何进行推理,所以交流是理解力的第三个要素。包括口头交流和书面交流。
根据对学生的课堂活动表现和对其学习成果的分析,可以推断出学生的理解力。活动的类型包括在课堂上和公开场合的研究报告,与同学或老师讨论科学问题以及在实验室进行实验。学生的学习成果包括考试成绩,每天的笔记,撰写的报告,图表,数据等。对于以活动表现和成果为依据的评价来说,交流是至关重要的。理解具有不同的角度和不同的深度,显然每个学生对知识的理解存在着角度和理解深度的合理差异,如何将这种差异性转化为对一个或一组学生关于知识理解程度的判断,是评价过程中所面临的一个挑战。
(3)对科学态度、情感与价值观的评价
(4)对科学技术与社会关系认识的评价
2.评价方法
学业成就评价采用的评价方法主要有连续观察与面谈、实践活动、书面测试、个人成长记录等方法。
(1)连续观察与面谈:通过对学生较长一段时间的连续观察或面谈,记录学生在物理课程达成目标上的表现,从而作出评价。该方法作出的评价较客观深入,但花费时间较多,适用于对学生某一方面或在某一段时间内的表现作出评价。
(2)实践活动评价:实践活动包括科学探究、实验、调查、科技制作、问题研讨、演讲表演、角色扮演等。实践活动评价指对学生在实践活动过程中的表现和成果作出评价,可以通过多种方法进行,评价主体要体现多元化,提倡采用个人、小组和班级等的组织形式。实践活动评价既可以在学习过程中进行,也可以在学习结束后进行。
(3)书面测试:书面测试是最常用的评价方法,试题设计要改变以知识记忆为主、脱离实际的书面测试内容和方法,在试题中要创设引起学生兴趣和联系实际的情境,加强试题的综合性、探究性和开放性。
(4)个人成长记录:由学生本人、家长、教师记录学生物理学习活动的成长经历,包括学习内容、学习成绩,在校内外参加科学实践活动的过程、体会、成果以及家长、教师的期望等,发展地、综合地对学生作出评价。
无论采取什么方法,在具体设计评价方案时都要关注学生科学素养的全面发展,要尽可能真实地反映学生科学素养的全貌,要有利于学生主动参与、积极探究、动手动脑,反对死记硬背、机械训练。要有利于培养学生学习物理的自信心和兴趣,评价的要求应适合学生的发展水平,学生正处于具体形象思维向抽象思维发展的阶段,应多采用创设具体生动的情境和鼓励表扬等积极的评价方式,肯定学生的学习进步。要注重学习过程的评价,力求对学生科学素养的原有基础、学习和探究过程、学习结果和长期效应四个方面作全程性的评价,注意定性评价与定量评价相结合,过程性的评价与终结性评价相结合。
评价过程应包括明确对学生学习的期望,收集并分析学生的表现和确定促进学生学习的关键因素三个部分。要把评价结果以书面或口头的方法及时地反馈给学生,不能单纯地告诉学生的学习成绩,同时要告诉学生学习的优势与不足,提出激励学生进一步达到目标的建议。
三.物理学业成就测验的编制
在学业成就测验中,试卷是测量的基本工具,试卷的优良与否,直接影响到考试的质量。为了编制出性能良好的试卷,在编制过程中,应当严格按照科学的编制方法和程序进行。编制试卷的一般步骤如下:
1.确定考试的目的
编制测验必须首先明确测验的目的,根据目的设计试题。例如,高考的目的是选拔具备高一阶段学习任务所需要基础知识和能力的考生,试题就应该有较好的区分度,能够鉴别不同能力的考生,发挥其选拔功能,否则就达不到高考的目的。
2.确定考试的目标
确定考试的目标是达到考试目的的需要,确定应测量什么,以及测量到什么程度等具体的考试目标,即要确定测验内容的取样范围和测验的行为目标,要对所测量的内容范围和能力要求作出具体规定。
3.确定试题的形式
试题的形式有客观型试题和主观型试题。一个完整的物理测验,应当包括各种形式的试题,以全面考查学生的认知行为。
4.制订命题计划
为了科学合理地进行测验,应根据测验的目的和目标,制订命题计划。命题计划应包括两部分内容:一是试题和试卷的编制原则和要求。具体说明考试的目标和内容范围,考试方法和试题类型,编制试题和组配试卷的要求等。二是试卷中试题分布的规定。具体规定出考试内容中,各部分的试题数量和占分比例,常常以命题双向细目表的形式给出。
5.编制试题
编制试题的具体依据是命题双向细目表、编制测验的基本原则、不同题型的具体编制要求等方面。
6.集合成测验试卷
在编排试题时,试卷的格式、试题的排列顺序,要符合一定的要求;试题的难易排列,要有层次,先易后难。编制测验的试卷,一般应有正题、副题以及补考题等,几份试卷要等价平行。
7.试卷命就后,教师必须亲自或指定其他教师进行试答,对学生能否按规定的考试时间答完全卷,作出较准确的估计。
8.编制标准答案,规定评分标准
标准答案要简明准确,评分标准要客观合理,能使分数合理反映考生的水平。
以上编制测验的步骤,主要适用于教师的自编测验,至于标准化测验除了要满足以上原则外,还有其它具体要求。
四.测验的质量分析与评价
1.信度
(1)信度的概念
对同一组考生测验成绩的稳定性程度,多次测验所得成绩得一致性程度,是衡量测验质量高低的一个重要指标,这个指标我们称为测验的信度。因此,信度是表示测验分数一致性或可靠性的质量指标,是测验结果能够反映考生稳定水平的程度。
一般地说,测验的试题对同一组考生只能使用一次。所以,为了研究一项测验地信度,最好再编制一套试题,它与所研究的测验中所使用的试题在考查方向、内容、类型、难易等方面是完全等价的,这样,我们将所研究的某项测验的一组成绩与使用等价试题再测试同一组考生所得到另一组成绩相比较,它们相关联、相一致的程度,就代表这项测验的信度。从统计的观点来看,两组变量的相关程度是用相关系数表示的。因此,我们也可以这样定义测验的信度,一项测验的信度,就是这项测验的一组成绩和对同一组考生实施等价测验所得的另一组成绩的相关系数,这个定义称为测验信度的统计定义。从测验误差的角度,信度所反映的是测验的客观性和测验结果的可靠性程度。一般而言,测验的信度值在0.8以上为基本合格。对于教学过程中教师进行的平时测验,其信度要求相对低一些,但对于大规模的考试(如高考)或者涉及教学研究方面的测验,其信度一定要高。
(2)信度的估计方法
估计信度的方法很多,在平常教学中,最常用的方法是分半信度估计。利用分半法估计测验的信度时,通常将全部试题按奇、偶数分成相等的两半,使这两部分的考查目的、内容、题型、题数、难度分布、分值分配等都相同或大致相同,这样就相当于把其中的一半试卷在相同条件下,对同一批考生考了两次,从而考查考生在两半测验上得分的一致程度。
3.目标参照测验的信度—复本估计法
目标参照测验目的不在于区分考生间的程度差异,因此,对于目标参照测验来说就不能再使用相关系数和方差来估计测验的信度。对于目标参照性测验,至今尚未有一种另人满意的估计信度的方法。
2.效度
(1)效度的概念
效度是衡量测验结果的有效性或准确性的质量指标,是反映测量结果与所要测量的结果相符合的程度,是一个测验对于它所欲测量的行为特征,能够测量到的程度。
(2)影响效度的因素
由于效度的种类不同,测验的目的、性质、功能也各有所异,因此,效度的高低与许多因素有关,例如测验的内容、试题的难度、区分度、测验的长度等因素对测验的效度都有不同程度的影响。下面就几个主要因素作以简要分析。
试题的组成:试题是组成试卷的要素,试题的性能是影响测验效度的主要因素之一。如试题的指导语不清楚、题意不明确、内容不合理、题量太少、题目的难度太高或太低、试题的编排不当等都可能使测验的效度降低。
考试的实施及评分:如课堂提示、学生作弊、考场混乱、时间不够、评分标准不统一等都会降低考试的有效程度。
考生考试的心理和情绪:考生的兴趣、动机、情绪、态度和健康状况等都影响考试结果的可靠性和准确性。
3.难度
(1)什么是试题的难度
难度是指测验试题的难易程度,它是试题对学生的知识和能力水平的适合程度的质量指标。表示难度的数量指标叫做难度指数,用P表示。
(2)估计试题难度的方法
3)用“两端分组法”估计试题的难度,在大规模考试中,常用两端分组法来计算试题的难度。不管是选择题还是论述题均可使用这种方法,而且通过这种方法还可以同时计算试题的区分度,因此这种方法受到广泛的欢迎。
(3)评判试题难易的一般标准
在实际运用中,人们通常把试题的难度划分为5个等级,并以此作为判断难易程度的标准。
4.区分度
(1)什么是试题的区分度
试题的区分度是指试题对不同知识和能力水平的考生的区分程度和鉴别能力。
(2)用“两端分组法”计算试题的区分度
这种方法与计算难度的两端分组法相同,只是计算公式不同,它是用统计某题的高分组通过率(或百分比)PH与低分组的通过率(或百分比)PL之差表示某题的区分度,即
D=PH-PL
式中,D称为区分度指数。-1≤D≤+1。当D=+1时,表示高分组全部答对,而低分组全部答错;反之,D=-1;若两组答对的百分比相同,则D=0。
(3)评价试题区分度的标准
D值越大,试题的区分度越大。艾贝尔(1965)提出了根据区分度指数D值的大小对试题质量进行评价的标准。
五.学生学业成就的评价一种质性评价方法:档案袋评定
1.什么是档案袋评定
作为一种从实践中涌现出的评定方法,尽管档案袋评定的出现已经有十年左右的历史了,但从教师们对档案袋评定的使用情况来看,很难给它一个确切的定义。正如对此有详细研究的美国课程评价专家约翰逊(Johnson,B.)所说:“如果要求5个不同的教师给档案袋评定下定义,你很可能会收到5个不同的答案——其中每一个都没有错。”这是由档案袋评定的性质决定的。
2.档案袋评定的意义
档案袋评定的主要意义,在于它们为学生提供了一个学习机会,使学生能够学会自己判断自己的进步。3.档案袋评定的类型
如上所述,档案袋评定依据使用目的、提交对象以及对学生的帮助等的不同,可以有各种不同的种类。对档案袋评定的分类,从不同角度入手也可以有不同的分类方法。美国南卡罗来纳大学教育学院教育心理学教授格莱德勒(Gredler,M.E.)以档案袋的不同功能为标准,把档案袋评定分为:理想型(ideal)、展示型(showcase)、文件型(documentation)、评价型(evaluation)以及课堂型(class)(如下表所示),其中最有代表性的是理想型。