Latest

“成败在此一考”是否有效与合理?学生能力评估方式的未来在哪?

在整个澳大利亚,学生们正在接收和消化重要的考试结果。不管你喜欢还是讨厌考试,长期以来,考试一直在教育中占据着重要地位。

a pupil after an exam

Source: Press Association

在整个澳大利亚,学生正在接收和消化重要的考试结果。大学生在11月底开始收到第二学期的成绩。本周和下周初,12年级的高中生也将收到最终成绩。

不管你喜欢还是讨厌考试,长期以来,考试一直在教育中占据着重要地位。

在几乎同样长的时间里,关于考试是否有助于评估学习的争论一直都很激烈。虽然在某些情况下转用了课程作业或其他形式来进行评估,但考试仍然是我们评估学生学习的主要方式。

为了理解为什么考试仍然受到青睐,我们回顾了支持和反对在高等教育中使用考试的争论。令人惊讶的是,我们发现几乎没有确凿的证据证明它们在大学评估中的广泛使用是合理的。

我们的研究

我们的重点是“非常重要的”期末试(权重很大的学期末考试,科目是否通过“成败在此一考”),因为这种考试被广泛使用。

传统上这种考试是在有严格监管的大型考场进行,对学生的生活和职业能产生巨大影响。

我们在高等教育文献中搜索了显示这种决定性期末考试的优点或缺点的研究。我们找到了122篇相关论文,由英文撰写,在2023年7月之前发表的。

这些论文中出现了七个关键主题。

一、对知识的记忆和掌握

长期以来,人们一直声称考试可以帮助学生巩固知识。

但由于考试往往鼓励在短时间内“填塞”大量信息,因此对这些“知识”的记忆通常都是短时间的。

当学生需要记住大量事实时,测试可以加强学习。但研究表明,学习完成稍后进行的定期简答测试比学习结束时的大型考试更为有效。

二、动机和学习

决定性的考试当然可以激励学生学习和准备。但有证据表明,考试往往无助于学生的学习,因为考试激活的是“外在动机”(获得高分的愿望),而不是“内在动机”(深入理解的愿望)。

这对学习产生双重不利影响:它会鼓励学生采用肤浅的“表面”学习方法,例如背诵,而教师也常常将教学内容缩小到考试可以评估的内容。
workplace
Source: Pixabay
三、与现实世界的关联

有些人认为,考试带有信息受限、时间紧迫的性质,这反映了现实生活(没有人希望他们的医生或飞行员在危机情况下翻阅手册)。

但对于绝大多数现代社会中的岗位和工作场所来说,闭卷式的个人考试与学生将会有的可与他人协作且信息丰富的工作环境相去甚远。

考试特别不适合评估雇主高度重视的倾听和沟通等技能。而且由于通常没有机会收到或答复考试的评语,学生很难从错误中吸取教训并做得更好。

四、有效性和可靠性

有人可能会认为,由于决定性考试对最终成绩非常重要,因此考试是经过仔细验证并能可靠地衡量学生的能力。

遗憾的是,两者都不是真的。大学课程中既不需要也不会定期来验证决定性考试的设计(一个复杂的过程,以确保我们可以信任我们从中做出的推论)。

考试成绩也是出了名的不可靠,容易受到考官的偏见和不一致、学生的心理或身体健康、考试设计甚至考试时的条件的影响。
五、合同作弊与评估安全

人们普遍认为,由于考试是在严格控制的环境中进行并且需要身份证明,因此考试不会受到作弊的影响。特别是近期对生成式人工智能的焦虑促使人们呼吁更多地使用传统考试。

但对澳大利亚和海外数万名大学生的调查显示,与其他形式的评估相比,学生在考试中作弊的情况更为频繁,他们使用各种手段,包括冒名顶替。

正如2018年澳大利亚报告的作者得出的结论:“考试给大学和认证机构带来了虚假的安全感。”

“过度依赖考试,而没有彻底和全面的诚信了解方式,可能会导致更多而不是更少的作弊行为。”
六、焦虑和幸福感

研究表明,学生觉得考试压力很大,这可能会损害他们的健康和福祉。但压力是否会影响考试表现还不太清楚。

一些研究发现压力会对表现产生负面影响,而另一些研究则没有发现任何影响,甚至表明压力有助于提高表现。

尽管尚无定论,但考试对学生身心健康的不利影响以及考试焦虑对学生动力的负面影响令人担忧。

七、公平公正

众所周知,考试青睐那些在时间压力下表现良好且善于记忆的学生。但也有越来越多的证据表明,考试可能会加剧性别不平等(女性在考试中的表现比男性差,但在非考试评估中表现更好)。

考试造成不平等的另一种方式是通过其内容(通常宣扬西方价值观和知识)及其书面方式(通常是手写的)。这对少数族裔学生不利,包括原住民学生、社会经济背景较差的学生或残障人士。

常用的“创可贴”式调整,例如允许额外的时间,对解决这个问题无济于事,而且会加剧人的自卑感。我们需要利用已知的包容性评估设计知识来确保不同的学生获得平等的成功机会。

未来之路

没有令人信服的教育理由来使用决定性期末考试,应该是因为这种考试的进行和评分费用低且效率高,并且规模易于调整,能适用于大量学生。

当我们知道在教育技术的帮助下还有其他更权威可替代的评估方式,并且这些方式还具有成本效益时,这些理由似乎就不够了。其他的评估方式包括调查(比如使用调查和解决问题的方式)、小组或同伴评估。

如果没有令人信服的学术理由来保留这种考试,我们必须考虑新的、可能更有意义的评估形式来替换、重新加权或重新设计这种决定性考试。

欢迎下载应用程序SBS Audio,关注Mandarin。您也可以通过苹果播客、谷歌播客、Spotify等播客平台随时收听和下载SBS普通话音频故事。

请在关注SBS中文,了解更多澳洲新闻。

 

分享
Published 15 December 2023 4:22pm
Source: The Conversation

Share this with family and friends