加州大学伯克利分校最新研究发现,自ChatGPT普及以来,美国高校中受AI影响较大的课程A等级占比飙升约30%,为AI加剧成绩通胀的担忧提供了实证。研究分析了50多万份成绩单,显示作业占比高的课程中A等级比例显著上升,而其他等级下降。
加州大学伯克利分校一项新研究为“AI 加剧成绩通胀”的担忧提供了实证数据。研究发现,自 2022 年底 ChatGPT 广泛使用以来,最容易受生成式 AI 影响的课程,其 A 等级占比飙升了约 30%。
该研究由伯克利高等教育研究中心高级研究员 Igor Chirikov 完成,于 5 月 13 日发布。研究分析了 2018 年至 2025 年间某大型公立研究型大学超过 50 万份成绩单。Chirikov 使用双重差分法,将作业高度依赖 AI 辅助的课程(主要为写作和编程密集型课程)与其他课程进行了对比。结果令人瞩目:ChatGPT 推出后,AI 暴露课程的 A 等级比例上升了 13 个百分点,相比 2022 年基线增加了约 30%。与此同时,A- 和 B+ 等级比例下降。在 ChatGPT 出现前,两类课程的等级分布相似;差距从 2023 年开始显著拉大。

效果集中在作业权重较高的课程中。Chirikov 表示,这一模式“更符合成绩通胀而非广泛的学习进步”,因为如果学生能力真正提高,所有考核形式的成绩都应上升,而不仅仅是无人监督的居家作业。
该论文发布之际,精英大学已在应对这一问题。哈佛大学文理学院本周正投票表决一项提案,将 A 等级比例限制在每班约 20%(另加最多四名学生),这与 2024-25 学年 66% 的本科生获得 A 的情况形成鲜明对比。耶鲁大学高等教育信任委员会在 4 月建议,大学采用 3.0 的平均绩点标准,并在成绩单上增加百分位排名。
雇主们也在调整。据求职平台 Handshake 数据,在明确要求 GPA 门槛的职位中,要求 GPA 3.5 及以上的比例从 2020 年的 9% 飙升至今年的 25%。宾夕法尼亚大学沃顿商学院的 Chelsea Shin 告诉《华尔街日报》,AI“大幅降低了能获得满分(100 分)的作业比例”,促使她将居家作业替换为课堂测验和期中考试。
Chirikov 早前在 2 月发表的研究发现,教师正逐渐从全面禁止 AI 转向基于任务的政策,允许在某些活动中使用 AI,但限制在其他活动中使用。然而,这次关于成绩通胀的论文表明,这些调整尚未遏制住趋势。正如 Chirikov 在 LinkedIn 上写道:“如果 AI 主要改善了学习,我们会预期所有考核形式的成绩都有所提升,而不是主要在居家作业权重更高的情况下提升。”
大学面临的问题不再是 AI 是否在重塑学业成绩指标,而是传统评分能否继续作为衡量学生真实知识水平的可靠标准。
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断