
在人工智能技术日益普及的背景下,如何有效应对学术作弊问题成为教育领域面临的重要挑战。纽约大学的一位教授创新性地探索了这一难题的解决方案,通过在”AI/ML 产品管理”课程中开展一场独特的口试实验,不仅揭示了学生知识掌握的隐忧,也反映出自身教学方法的改进空间。教授 Panos Ipeirotis 与共同授课的 Konstantinos Rizakos 在实验中发现一个令人深思的现象:许多在书面作业中表现出色的学生,却在口试环节难以清晰阐述其作业背后的基本决策逻辑。图源备注:图片由AI生成,图片授权服务商Midjourney

为了突破传统考核方式的局限,两位教授引入了一种基于人工智能的口试系统,该系统采用了先进的 ElevenLabs 语音AI代理技术。整个考试流程分为两个核心部分:首先,AI代理会系统性地询问学生关于最终项目的目标设定、数据来源、建模决策过程、评估方法以及遇到的失败模式等关键问题;其次,AI会从课程内容中随机抽取案例进行深入提问。在为期九天的实验中,共有36名学生参与了口试,每场考试平均耗时25分钟,而总成本仅为15美元,人均费用低至42美分,这种高效低成本的考核方式展现出巨大的应用潜力。
尽管作为初次尝试的AI口试系统存在一些待改进之处,例如部分学生反映AI代理的语气过于严厉,且有时会一次性提出多个问题导致沟通效率降低。经过针对性的优化调整后,AI代理的表现有了显著提升。在评分环节,研究团队创新性地采用了由Claude、Gemini和ChatGPT三种顶尖AI模型共同评分的机制。虽然初始评分的一致性有待提高,但通过AI模型间的相互审阅机制,最终评分的准确性得到了显著提升,这种多模型协作的评分方式为教育评估提供了新的思路。

值得注意的是,尽管大部分学生认为AI口试带来的心理压力大于传统书面考试,但高达70%的学生表示这种考核方式确实能够更有效地检验他们的实际理解能力而非单纯记忆。Ipeirotis教授对此指出,人工智能技术的进步使得传统上难以大规模实施的口试考核成为可能,学生可以通过与AI的反复互动练习,切实提升自身的批判性思维和表达能力。划重点:📊 实验结果显示,学生在口试中暴露出书面作业与实际理解能力之间的显著差距。 💰 基于AI的口试系统将每位学生的考核成本降至42美分,相比传统口试方式具有极高的经济效率。 🤖 尽管学生普遍反映AI口试压力更大,但大多数参与者认可这种考核方式更能准确评估他们的真实能力水平
