当大众热议高考热度减退,AI 已经悄然占据了在高考语境的中心位置。
今年北京卷、上海卷直接将人工智能与科技融入考题,把 AI 议题深度结合社会现实展开设问。
不过更耐人寻味的是,数十家媒体在高考语文结束后第一时间组织大模型挑战高考作文,掀起一股“哪家AI高考作文写得好”的评价风潮,还请来了高考命题组的阅卷老师来对不同AI的写作能力进行打分。
豆包、DeepSeek、千问、ChatGPT、KIMI都成为了高考外场外最卖力的考生,在同台激烈竞技。
然而,当人们执着于追问 AI 、测评AI能否写出满分作文、甚至开始质疑,如果 AI 能轻松驾驭写作,学生的写作训练还有何意义?这一舆论转向的背后,隐藏着更核心的深层逻辑。
写作,一直是人类区别于 AI 最核心的能力分野。写作承载着个体的生命体验、独立思考与情感表达,是机器无法复刻的人文特质。大众之所以紧盯 AI 写作能力,本质上是在试探,人类最后一块专属的思维与表达阵地,是否正在被技术攻破?
倘若语文写作能够被 AI 替代,传统教育中的机械训练、标准化答题,还有多少意义?当 AI 包揽知识、解题与创作,基础教育该舍弃什么、守住什么?
脱离了分数与标准答案,教育要培养的真正不可替代的能力究竟是什么?
当AI遇上高考作文:
表现“差强人意”
一个话题出现在高考作文中,意味着它已经被整个社会公认为这是这一代人绕不开的问题。
今年高考作文题中,北京卷、上海卷与全国一卷相继触及AI人工智能议题。
北京卷微写作聚焦日常场景,以 “教老年人使用 AI” 为题,引导考生观察 AI 融入大众生活的现实图景。
上海卷更进一步,探讨科技在重塑世界的同时,也在潜移默化地改变人类的认知与想象,将视角从实际应用延伸至思维层面。
全国一卷则落脚于语言文字的演变,在 AI 发展的大背景下审视词语的迭代更新,把思考推向语言、文化与人文根基的深层维度。
这几个命题瞄准的是人与技术的关系、AI对创造力的影响以及技术与人文的边界,这也是当下教育引导学生探索的重点方向。
高考结束后,各大主流媒体纷纷发起 AI 作文测评活动,多款主流大模型轮番参与高考作文作答,并邀请专业阅卷老师点评打分。
校长邦使用全国一卷和上海卷的高考作文题,并选取豆包、DeepSeek、KIMI、千问、ChatGPT等国内外五大主流大模型进行横向对比测试。
1)豆包:素材覆盖面广,在上海卷的作文命题中,豆包采用了古代嫦娥奔月、现代卫星遥感、AI等例子,显示出较好的知识储备;在立意方面,科技为想象插上翅膀”和“担当”词语的选择比较中规中矩。
2)DeepSeek:上海卷中科技与想象力如“舵与帆”,思辨能力较强;与文章主题部分相比,结尾略显仓促,全国一卷中“上进”词语的选择相对常见。
3)KIMI:两篇均体现出一定的理论素养和开阔的学术视野。上海卷引用了柏拉图的洞穴寓言,偏学者风,全国卷偏思想者风。共同问题是理论密度偏高,在高考阅卷中可能存在“叫好不叫座”的风险。
4)千问:论证较为扎实,对“科技可模拟想象却无法替代意义追问”的洞察有深度,错题本等细节真实可感;语言风格偏理性克制。
5)ChatGPT:在立意上选择“优秀不是所有人眼中的第一名,而是在热爱的方向上持续努力”,有一定思辨性。但文采方面翻译腔较明显,同时,叙述较为平铺直叙。
结合校长邦测评与其他媒体测评发现,审题准确、结构完整、逻辑清晰、语言流畅,已经成为各大模型写作的基本能力,发挥基本稳定。
但从整体测评分数来看,AI作文的天花板非常统一,所有测评最高分都离满分差3-4分,卡在一类作文下沿。
换言之,目前主流大模型虽都能产出一篇标准的优质作文,却始终难以触及顶尖水准。
从筛选学生到检验AI
大模型迎来“大考”
某种意义上,高考作为正在成为AI能力展示的公共舞台,同时,高考作文的价值属性逐渐有了新重点,从筛选学生变成检验AI。
过去,高考作文是评价学生能力的工具,而今天,高考作文正在反过来评价AI能力,人们关注的不再只是考生能得多少分,而是AI能得多少分。
这种角色转换,意味着AI已经跳出了传统工具的定位,升级为需要被测评、被对比、被审视的全新能力主体。
那为什么是高考作文成为了AI的能力测试场?
高考作文成为全网测评AI的首选载体,本质是因为它的考查维度足够综合。一篇高质量的考场作文,需要同时具备文本理解、逻辑架构、知识储备、语言表达、价值思辨五大核心能力。对于大模型而言,没有比高考作文更合适更综合的公开测试题了。
因此,高考结束后AI集体“赶考”,其实不是一场流量游戏,而是一次社会对于AI能力边界的集中检验。
值得注意的是,已掌握应试高分逻辑的AI,始终无法突破“人类主体性”的核心壁垒。
从阅卷老师的统一测评结果来看,如果按照高考评分标准衡量,AI作文已经能够稳定进入高分区间。
但与此同时,几乎所有专家也指出了相同的问题:缺少真实经历;缺少个体情感;缺少生命体验。
这些评价看似老生常谈,却恰恰触及了AI写作和能力最核心的边界。
今天的大模型已经学会如何写一篇正确的作文。它知道什么样的开头容易得分,什么样的结构更完整,什么样的论证更符合评分标准。
但它并没有真正经历过作文里所描述的人生,AI最大的短板并非文笔,而是主体性。
它可以描述离别,却没有离别的记忆;可以描写成长,却没有成长的体验;可以讨论梦想,却没有属于自己的梦想。它拥有知识,却没有经验;拥有语言,却没有人生,而这恰恰也是教育最珍贵的部分。
更深层的来看,AI应试能力越强,越印证了传统教育的评价体系需要重构。
如果说知识获取正在被AI大幅降低成本,那么真实体验、价值判断、独立思考和创造性表达,反而会变得更加重要。
这或许也是为什么越来越多教育工作者一直在思考一个问题:当AI能够写出标准答案时,教育究竟应该培养什么样的人?关注AI大模型能力边界的从业者,也不过是希望明晰一个确切的目标方向。
AI教育议题的两端:
从高考作文到高校扩招
高考在"考态度",大学在"培养人",同一个AI议题的两端已经接通。
今年三套卷子考AI的底层逻辑是一样的。考生能不能对一个AI时代的问题,给出有"人味"的思考和态度?这是高考端。
另一端,2026年高考前,西安交大新增"具身智能"、"数据科学",扩招360人全部投向AI和集成电路;北京师范大学获批全国首个"人工智能教育"本科专业;华南理工大学开出AI先进技术拔尖班,双院士领衔,本博贯通。超过600所高校开设了AI专业方向。
这不是巧合。高考用作文题告诉社会AI是这一代人绕不开的问题,大学同时用扩招计划回答绕不开的问题需要什么样的人来解决。
两条线在同一个时间窗口合拢了,高考筛选态度,高校培养能力。
与此同时,扩招的不是会用AI的人,而是能造AI的人,这中间有一道隐性分水岭。
仔细看今年高校AI扩招的名单,扩的是集成电路、具身智能、仿生智能机器人、数据科学——全是"硬核AI",不是"AI应用"。
这和高考作文正在发生的变化相契合。高考作文不再考"会不会写标准答案"(那是AI的长项),转考有没有独立思辨(那才是人的长项)。高校同理,不是扩招更多"会调参"的人,而是要能定义问题的人。
高考作文坚持考"你有没有活过、想过、感受过",不是保守,是远见。因为AI时代淘汰的是除了会用AI,没有其他东西的人。
高考正在用作文题守住一个底线:不管考生将来学不学AI、进不进这个产业,教育首先得培养的是一个独立思考的人。
教育界网