怎样评价学生才有效?怎样通过评价促进学生的学习与发展?这是很多中小学教师一直在努力思考并感到困惑的问题。本书针对这些问题给出了令人满意的答案。
本书作者从事过三四十年的中小学教学和课程研发工作,曾询问过无数教师对评价的看法及他们本人的评价实践情况。在此基础上,她结合自己的工作和生活经历,对传统评价方法中存在的问题进行了探讨,试图让人们从“标准化考试的神话”中走出来,走向多元化评价的光明大道。作者在书中通过大量实例系统、详细地介绍了当前最有效的学生评价方法与策略。
作者擅长运用生活和工作中的事例来阐述自己的评价观念与方法,让全书的内容通俗易懂且生动有趣,读起来会有一种轻松愉悦的感受。该书具有较强的可读性和实践指导性,很适合广大中小学教师学习与借鉴。
最近,我上门拜访了朋友,是朋友3岁的女儿梅甘为我开的门。梅甘热情洋溢地和我打了招呼,“你看看我,埃伦阿姨”,梅甘的眼睛睁得大大的,脱口而出来了句“我的打扮好适合自己!”。
另外一次,我听到一个被父亲拉着逛街购物的小孩说了句:“爸爸,我的鞋子穿着一点也不舒服了”。梅甘对自己的评论让我不得不去思考它所蕴含的内涵和智慧所在。小姑娘兴高采烈,因为她穿的鞋子、衣服和头上扎的丝带与“她本身”是那么匹配。对梅甘而言,这一切搭配到一起就是最完美的体现。同样的道理,我们在寻求与学习活动和学习者本身非常匹配的评价活动。与此形成对照的是,你是否可以回想起一项既不契合学习活动也不契合学习者的考试呢?
目前,我们也许可以发现,教育界近些年来发生了翻天覆地的变化—这些变化是立足于学习者更加能够真正学习的方式方法的,而不是立足于学习者应当如何学习的神话的。我们正处于这样一个时期,即评价活动比过去更加契合学习活动了。但我们依然任重而道远。
传统意义上的评价活动是在一节课或一个单元结束后进行的,这就好比蛋糕冷却之后才去冰冻,已错过了评价的最好时机。现在的课程规划者建议教师在课程规划阶段就考虑评价问题。评价应该是推动学习的动力,而不应该是“跟着火车头的车厢”。那么,评价作为学习的推动力能够给一节课带来什么样的变化呢?将考试放在单元或课程学习的开始时进行与结束时进行有什么不一样呢?如果一堂课要讨论的问题是美国或加拿大对国际饥饿问题将做出怎样的举动,学生为了解决这个问题,就需要去收集一些统计资料,对事实进行比较分析,列举出历史上美国与加拿大对国际饥饿问题曾经采取过的措施,最后学生需要提出新的解决方案。与此相应的评价活动可能包括:撰写一篇与统计资料有关的文章,进行一次与传统反应相关的讨论,策划一个新的为了缓解国际饥饿问题的商业企业市场计划。
如果学生头脑里一开始就有“评价”观念,他们就不会只是去简单地记忆一些国际饥饿事件的点点滴滴的事实了,而会去认真地考虑课程内容,因而他们就能更好地把注意力放在理解一些重要的概念上,会在一个更高、更深的层面上去探讨问题,并且会通过合适的评价活动去寻求解决问题的新方法,如此一来非常有助于解决所提出的问题。
在任何单元学习开始的时候,评价活动的计划都有书面考试这一项内容,但评价活动远不止这一项内容。评价活动还应该包括:对学生在学习过程中掌握知识的情况的评价,对学生最后达成学习目标的情况的评价。要想考查学生到底掌握了多少知识,学生、教师和家长就需要建立起评价的协作关系。表面看来这个评价小组所做的评价工作是回溯性的,但是当我们把评价作为推动力时,他们事实上起着推动前瞻的作用。
20世纪90年代以来,传统意义上的单元学习结束后的评价正在逐渐被更多的真实性评价(authentic assessment)所代替。真实性评价要求学生去解决他们所关心的问题,因此,那些以知识为基础的、零敲碎打的、机械的评价活动正在逐渐被基于表现的、基于成长档案袋的、基于知识背景的评价活动所代替。现在越来越多的学区正在执行新的、以结果为导向的表现性计划(performance design)。表现性评价(performance assessment)要求学生展示他们所掌握的知识的情况。运用这种评价方式时,学生就不会在课堂上消磨时间,或者在考试前的一个晚上复习,死记硬背一些支离破碎的知识来应付考试了。这种评价方式并不会要求学生因循守旧地学习知识,而是有助于学生达成意义非凡的学习目标。在这种评价体系下,学生能够直截了当地展示他们所掌握的知识。这种评价体系要求教师在单元学习的导入部分就向学生清楚地强调学习目标和教学目标。
一般来说,人们会认为传统的评价方法更多的是测查学生短期内的回忆能力,它只是要求学生解决一些人为虚构的问题,获得一些没有实际关联的答案,因而这种评价方法测查到的只是学生的部分知识和部分能力。比较而言,真实性评价运用多种测查方法,学生面对的是一项挑战,学生要对所提供的资料进行研究,最终必须解决一个真实的问题。真实性评价活动的目标具有适宜性,学生在解决复杂问题时允许出现个体差异性。真实性评价并不是想要用一些令学生愁眉不展的任务来难住学生,恰恰相反,它是想通过激发学生的兴趣和发掘学生的潜能来使学生超越自我,获得成功。
在本书中,我提供了一些有助于学生根据自身独特倾向来完成评价任务的评价活动和评价策略。在此要强调的是,这些评价活动和评价策略在课堂上是适用的,具有很强的可操作性。在本书中,我介绍了霍华德加德纳(Howard Gardner,1991)的多元智能理论中解决问题的八种方法。这八种方法分别是:数理逻辑探究方法、语言探究方法、空间探究方法、音乐探究方法、身体运动探究方法、人际关系探究方法、内省方法、自然探究方法。
多元智能理论在评价活动中的运用,把学生评价从测查学生考前的回忆能力转变到了测查学生在具体标准下知识、技能的掌握情况。通过利用学生先前已有的知识、能力和兴趣,学习活动与评价活动两间之间基本达成了一致。比如说,我们要求学生阐释如何制造或销售一台发动机,与此相应的评价活动可能是要求学生演示真实的发动机的制造过程,同时要求学生在模拟市场中向家长们出售这台发动机。传统的评价方法则是简单地要求学生写一篇说明这台发动机的零部件构成的说明书,或者让学生回答一些多项选择题。事实上,演示过程应该与学习过程保持高度一致才最有效果。
本书首先介绍了学生、教师和家长在评价中所发挥的作用。这些学生、教师和家长对任何一种学习方案都达成了一致的期望,对评价术语和评价条件通过协商也达成了一致的看法。由于他们承担着共同的职责,所以学生的焦虑感得到了缓解,学习就变得更加直截了当,而且学习的目的也非常明确。然而,在鼓励学生对某个主题从多种角度进行了解之后,教师如何对学生的了解进行评价呢?我(1997)在阐释多元智能教学法(Multiple Intelligence Teaching Approach,MITA)时,阐述了理解任何一种内容可以运用的多种方法,其中把表现性评价作为学习过程的重点进行了说明。
加德纳的多元智能理论
数理逻辑智能:包括数学、资料、事件的逻辑顺序、问题解决的步骤,等等。
语言智能:包括头脑风暴活动、书面文字、辩论、演讲、媒体报导,等等。
空间智能:包括视觉空间感受物的呈现、图表、几何设计、图形、艺术品展示、雕塑,等等。
音乐智能:包括对音调、旋律、节奏和音色的感知与辨别、歌词、乐曲、器乐作品、背景音乐、文化特色(特定音乐与特定文化有关联),等等。
身体运动智能:包括运动、跳舞、角色扮演、建构模型、搭建项目、游戏,等等。
人际关系智能:包括小组工作、跨文化方案、小组解决问题、合作活动、结对共享,等等。
内省智能:包括记日志、从一个著名政治家或运动员的角度写信、自我管理、道德判断,等等。
自然智能:包括从一个著名的环保主义者或人类主义者的角度进行访谈、一个大型牛奶场的自行管理、站在农业和动物利益的角度进行道德判断,等等。
这里需要说明的是,加德纳于1996年提出了“自然智能”这一概念。
与关键人物协商时,评价就与学习联系起来了。本书阐述了协作的、真实的评价活动背后的理论假设,也介绍了具体的评价方法和评价活动。这些方法和活动体现了今天脑科学对知识本质的认识和对教育学产生的启示。科恩(Kohn,1993)特别强调教师对应用于课堂中的所有评价实践活动所蕴含的理论假设有所了解的重要性。因此,本书所介绍的评价活动都存在着相关的最佳学习方式的重要理论假设和蕴含的智能意义的理论假设。
科恩提出,当每个教师都拥有自己的一种学习理论时,那么,人们所认为的卓越的学习与优秀的教学活动和用来评价知识的策略或活动就会存在巨大的差异。我差不多从事了30多年的教学和课程研发工作,在此期间询问过无数教师对评价的看法和他们本人的评价实践情况。凯恩等人(Caine & Caine,1997)的研究发现,一些教师经常会回避今天出现的创新教育策略,依然去运用传统的或过时的心智模式。然而,正如凯恩等人所说的那样,陈的葡萄酒不可能有新的葡萄酒的味道:
基于我们的研究,我们相信,教育在经历了如此多的“有效策略”阶段之后,却依然如故,原因之一就是教学与学习的心智模式并没有发生任何改变。表面意义上的变化只需要使用新的词汇和新的解释方式,但其中那些时时刻刻都在驱动着我们的活动的基本信念并没有发生任何变化。我们用一位校长激动万分地告诉一位朋友的话作为结束语,那就是:“噢!我们去年实践了基于脑科学的学习;今年我们正在推行基于建构主义的学习。”(Caine & Caine,1997,p. 22)
在本书中,我检验了一些评价的理论假设,提出了一些基于协作实践、真实性评价实践和主动学习实践的新策略。一方面,我对关于教师、学生与家长在学习—教学—考试过程中所起作用的一些根深蒂固的观念提出了质疑。我阐释了10种非常流行的传统的标准化考试的神话,同时揭示了这些神话是如何影响教学和学习的。另一方面,我提出了基于协作性、真实性模式的有实践操作性的评价活动。在本书中所反映的教学方法要求范式的转变,即转变教师控制的传统教学模式。本书中对凯恩等人(1997)提出的以学生为中心的教学方法进行了阐述:
我们所设想的基于脑科学的教学……是以学习者和学习者真正的兴趣为中心的。这种教学具有灵活性和开放性。这种教学包括学生个人或学生集体富有批判性的思想、有价值的问题和目的明确的计划方案。在这种教学方式中,教学具有高度的组织性和动力性,它能够让学生体验到真实生活的复杂性。(p. 25)
本书介绍了与评价相关的三个问题。第一部分介绍的是协作性评价。其中阐述了学生、家长和教师在评价中所起的作用。在第一部分中,我还介绍了一些关键人物的协作性评价的范例。
第二部分介绍的是真实性评价。这种评价方法可以在传统教学课堂中使用,对那些想重新组织课堂教学以促进更多主动学习的教师特别有效果。也就是说,这部分对于那些希望在评价中包括下列因素的中学教师会很有用:进度性指标的反映、多重测查者与评估者、学生的个人兴趣和能力、需要解决的现实生活问题。
第三部分阐述的是注重协作和主动学习的一系列特定的评价活动。本书的每一部分都有适合课堂使用的评价活动,最后这部分成为了为增进学习而创设的协商评价活动的基石。
第一部分 协作性评价实践
第一章 作为评价伙伴的学生、教师与家长
真实性评价和表现性评价
作为积极参与者的学生
把厌倦变为挑战
作为自主学习者的学生
作为知识传授者的教师
作为高级学者的教师
作为学习伙伴的教师
家长的参与
与家长的伙伴关系
第二章 作为评价专家的教师
形成性评价和总结性评价
教师在评价实践中所面临的问题
改变教师方法的形成性评价
形成性评价与终结性评价的优劣
作为意义创造者的教师
基于探究的学习方案
第三章 改进评价实践的合作
来自高纬度北极地区的经验
教师之间的相互支持
责任感的问题
协作评价的收获
对评价的对立观点:有利还是有弊
作为行动研究者的教师
作为问题界定者的教师
作为解决方案创造者的教师
第四章 共同承担责任的问题
给家长的建议和机会
学校在学习伙伴中所发挥的作用
充满活力的学习共同体
为你所在社区的历史喝彩
企业的参与
协作需要建立清晰的评价指标
为了学生成功的同伴指导
第二部分 真实性评价实践
第五章 运用成长档案袋评价学生的个体差异
多元智能评价方法
随堂记录卡
教师小组评价和成长档案袋评价
成长档案袋的组织
共同的期待
从成长档案袋获得的最大收获
第六章 传统情形下的真实性评价
对学习风格的考虑
所有课堂都引进真实性评价
拟订学习契约的步骤
学习契约的范例
传统评价或者真实性学习的评价
真实性评价有时候会伴随传统评价的发生
第七章 个人表现与小组表现相结合
学习小组内部冲突的解决
有助于学生解决小组冲突的核查表
小组的成长与发展
一个有意义的小组计划的诞生所必经的阶段
高质量讨论的促成及评价
第八章 评价标准的协商与执行
优先协商
多元智能教育
建构主义教育
共同体教育
成果导向教育
真实性评价的任务
转变的原则
第三部分 丰富的评价活动
第九章 作为主动学习构成部分的评价
将评价作为完整的主动学习的一部分
更具协商性的评价活动
提供并展示评价方案
对评价方案的执行进行录像和整理归档
怎样确立清晰的表现目标
表现目标可以包括具体条件
促进学习的评价
与动机、兴趣、指导和评价有关的问题
第十章 传统测试的神话
传统评价方法中存在的问题
标准化考试的十大广为人知的神话
传统评价是学习的绊脚石?
情境中的评价
传统评价和真实性评价的差异
是铤而走险,还是就为了犯错误?
与传统评价紧密相关的术语
压力是成功的障碍
第十一章 将学生的进步与具体目标相联系
评语在评价报告中所发挥的作用
对英语课堂中的表现和进步的评价
对学习和进步的自我评价
小组学习的同伴评价
评价实践将向何处去
第十二章 学生评价将走向何处
为研究论文建构一个评价标准
个人标准与小组标准
自我评价
家长的角色
从传统考试到评价作为学习的一部分
增强学习动机的评价
结论
参考文献
标准化考试的十大广为人知的神话
1.标准化考试会激励学生提高学习成绩。事实上,结果恰恰相反。许多考试的结果显示其带有某种种族和文化偏见,因为这些考试没有充分考虑到文化背景的多元性。通常,一些学生在学习上付出了最大的努力,却只获得了很低的分数,这种考试的不公平性大大挫伤了学生的学习积极性。
2.在标准化的数学和阅读考试中获得高分能够保证进入待遇优厚的职业。而在其他领域,比如说音乐领域、视觉艺术领域、人际交往或身体运动等领域,往往在于教学生学会思考和掌握问题解决的技巧,这些领域又会怎么样呢?答案并不容乐观,因为传统的标准化考试通常建立在对智能概念和真实学习活动持狭隘而陈旧的理解的基础上。
3.考试成绩优秀的学校就是好学校。不列颠哥伦比亚省的一所中学以自己学校取得的优秀成绩而颇感自豪。但如果去认真地调查一下就会发现,该校中一些经验丰富的教师正是某些考试试卷的编制者,他们所教的就是如何让学生全力以赴地去应对这些考试。这是真正意义上的成绩吗?难道学校仅仅为了“看起来很好”的标签就不惜代价了吗?
4.考试分数提供了准确测评和比较教师工作业绩的方法。由于教师感受到了来自政府和学生方面的压力,所以他们极有可能只是教会学生如何在考试中获得好成绩。那么,建立在这个基础上的教师之间的比较还有什么实质意义呢?
5.标准化的考试成绩会给家长提供明确的数据来了解孩子的表现。加德纳博士和罗伯特斯滕伯格博士是研究大脑如何工作以及学习如何发生这方面的专家。他们认为,对孩子进行多种能力的评价才更为有效。如果一个教师强调学生的实际应用能力、问题解决能力、分析综合能力,那么测试本身就应该包括写文章、成长档案袋、方案设计以及对学生理解能力和运用知识的评价。
6.标准化考试得分点的知识非常明确。正因为如此,教师通常会为考试分数而教学,学生只是被动地接受教师灌输的应考知识,这样一来,建立在师生互动基础上的多种学习形式就不可能被采用。
7.标准化考试可以保证所有学生都能学习常识性的课程。在今天这样一个信息技术十分发达的社会里,就算不通过考试也能轻而易举地做到这一点。现代技术给学生提供了丰富的信息资源和与人交流的机会来拓宽自己的知识面。
8.考试成绩将决定哪些学生会在市场竞争中取胜。其实,是协作精神而不是竞争精神,更能让学生在毕业后的各种工作机构站住脚并工作出色。
9.标准化考试将为学生走出校门、走向社会的竞争做好准备。这种说法有些片面。孩子要向同伴、家长和社区中的其他人学习,要从书本中、电视里或录像里学习,这些学习就跟学校里的学习活动一样。标准化考试却没有认识到多数孩子学习方式和学习场所的多样性。
10. 标准化考试是促进学生智能发展和学习进步的有效措施。脑科学研究的最新成果提出了基于下面三个原则的新的学习方法:①学习需要学习者的积极参与才会发生;②人们是用不同的学习方式和不同的速度学习的;③学习既是个体行为,也是集体行为。
虽然教育行政部门可以运用标准化考试的成绩来比较、评判教师的教学业绩,但并不能保证对学习者的学习能力做出了准确的评价。精确的评价需要额外的、真实的评价手段。时代已发生了很大的变化,年轻人需要应对变化莫测的全球化社会,一系列的标准化考试的数字并不能帮助他们为应对这样的社会变化做好准备。就拿数学老师来说,他们承认在让学生学会应用数学教育中获得的数学理论方面,已做了好长一段时间的尝试,而现在的教育更重视培养学生的反省思维能力、观察能力和批判性思维能力,这对于某些学科特别是数学学科而言,并非轻而易举的事情。
一位十年级的数学教师讲述了他帮助学生发现自己是如何进行数学思维的策略。在开始阶段,这位教师鼓励学生超越那些传统机械的数学学习方法,由此学生得以在较高水平的思维或元认知(对自己思维的思维)活动方面取得了成功。最后,他让自己班上的学生和邻近小学中的学习差的学生进行合作学习。学生非常喜欢这种作业方式,乐意观察小学生从而发现他们是如何进行数学思维的。
在这项作业中,这位老师要求学生做好观察记录,并且记录自己对小学生的思维了解到什么程度的反思。不用质疑,这种形式的合作学习取得了成功。小学生非常高兴地请十年级的同学帮助自己解决数学难题,十年级的学生也认真记录着这些小学生运用不同的数学基本技能的过程。由于两个班级的积极响应,这项合作持续的时间比预期的要长,最后以学生搭档合作,以当场表演解决复杂的数学问题的形式来宣告这次活动的结束。对于两个小组的成员来说,合作学习带来的积极的学习体验远远超过了个人单独学习时所获得的。它为学习数学的学生提供了一次理论联系实际的机会,其中的几个中学生还利用他们所学到的知识来帮助小学教师创建数学学习中心。