教育界网 > 教育热点 >正文

高考作文AI测评大战！ChatGPT、DeepSeek比拼，谁是最强大模型？

教育热点

作者：原创发布时间：2026-06-08

当大众热议高考热度减退，AI 已经悄然占据了在高考语境的中心位置。

今年北京卷、上海卷直接将人工智能与科技融入考题，把 AI 议题深度结合社会现实展开设问。

不过更耐人寻味的是，数十家媒体在高考语文结束后第一时间组织大模型挑战高考作文，掀起一股“哪家AI高考作文写得好”的评价风潮，还请来了高考命题组的阅卷老师来对不同AI的写作能力进行打分。

豆包、DeepSeek、千问、ChatGPT、KIMI都成为了高考外场外最卖力的考生，在同台激烈竞技。

然而，当人们执着于追问 AI 、测评AI能否写出满分作文、甚至开始质疑，如果 AI 能轻松驾驭写作，学生的写作训练还有何意义？这一舆论转向的背后，隐藏着更核心的深层逻辑。

写作，一直是人类区别于 AI 最核心的能力分野。写作承载着个体的生命体验、独立思考与情感表达，是机器无法复刻的人文特质。大众之所以紧盯 AI 写作能力，本质上是在试探，人类最后一块专属的思维与表达阵地，是否正在被技术攻破？

倘若语文写作能够被 AI 替代，传统教育中的机械训练、标准化答题，还有多少意义？当 AI 包揽知识、解题与创作，基础教育该舍弃什么、守住什么？

脱离了分数与标准答案，教育要培养的真正不可替代的能力究竟是什么？

当AI遇上高考作文：

表现“差强人意”

一个话题出现在高考作文中，意味着它已经被整个社会公认为这是这一代人绕不开的问题。

今年高考作文题中，北京卷、上海卷与全国一卷相继触及AI人工智能议题。

北京卷微写作聚焦日常场景，以 “教老年人使用 AI” 为题，引导考生观察 AI 融入大众生活的现实图景。

上海卷更进一步，探讨科技在重塑世界的同时，也在潜移默化地改变人类的认知与想象，将视角从实际应用延伸至思维层面。

全国一卷则落脚于语言文字的演变，在 AI 发展的大背景下审视词语的迭代更新，把思考推向语言、文化与人文根基的深层维度。

这几个命题瞄准的是人与技术的关系、AI对创造力的影响以及技术与人文的边界，这也是当下教育引导学生探索的重点方向。

高考结束后，各大主流媒体纷纷发起 AI 作文测评活动，多款主流大模型轮番参与高考作文作答，并邀请专业阅卷老师点评打分。

校长邦使用全国一卷和上海卷的高考作文题，并选取豆包、DeepSeek、KIMI、千问、ChatGPT等国内外五大主流大模型进行横向对比测试。

1）豆包：素材覆盖面广，在上海卷的作文命题中，豆包采用了古代嫦娥奔月、现代卫星遥感、AI等例子，显示出较好的知识储备；在立意方面，科技为想象插上翅膀”和“担当”词语的选择比较中规中矩。

2）DeepSeek：上海卷中科技与想象力如“舵与帆”，思辨能力较强；与文章主题部分相比，结尾略显仓促，全国一卷中“上进”词语的选择相对常见。

3）KIMI：两篇均体现出一定的理论素养和开阔的学术视野。上海卷引用了柏拉图的洞穴寓言，偏学者风，全国卷偏思想者风。共同问题是理论密度偏高，在高考阅卷中可能存在“叫好不叫座”的风险。

4）千问：论证较为扎实，对“科技可模拟想象却无法替代意义追问”的洞察有深度，错题本等细节真实可感；语言风格偏理性克制。

5）ChatGPT：在立意上选择“优秀不是所有人眼中的第一名，而是在热爱的方向上持续努力”，有一定思辨性。但文采方面翻译腔较明显，同时，叙述较为平铺直叙。

结合校长邦测评与其他媒体测评发现，审题准确、结构完整、逻辑清晰、语言流畅，已经成为各大模型写作的基本能力，发挥基本稳定。

但从整体测评分数来看，AI作文的天花板非常统一，所有测评最高分都离满分差3-4分，卡在一类作文下沿。

换言之，目前主流大模型虽都能产出一篇标准的优质作文，却始终难以触及顶尖水准。

从筛选学生到检验AI

大模型迎来“大考”

某种意义上，高考作为正在成为AI能力展示的公共舞台，同时，高考作文的价值属性逐渐有了新重点，从筛选学生变成检验AI。

过去，高考作文是评价学生能力的工具，而今天，高考作文正在反过来评价AI能力，人们关注的不再只是考生能得多少分，而是AI能得多少分。

这种角色转换，意味着AI已经跳出了传统工具的定位，升级为需要被测评、被对比、被审视的全新能力主体。

那为什么是高考作文成为了AI的能力测试场？

高考作文成为全网测评AI的首选载体，本质是因为它的考查维度足够综合。一篇高质量的考场作文，需要同时具备文本理解、逻辑架构、知识储备、语言表达、价值思辨五大核心能力。对于大模型而言，没有比高考作文更合适更综合的公开测试题了。

因此，高考结束后AI集体“赶考”，其实不是一场流量游戏，而是一次社会对于AI能力边界的集中检验。

值得注意的是，已掌握应试高分逻辑的AI，始终无法突破“人类主体性”的核心壁垒。

从阅卷老师的统一测评结果来看，如果按照高考评分标准衡量，AI作文已经能够稳定进入高分区间。

但与此同时，几乎所有专家也指出了相同的问题：缺少真实经历；缺少个体情感；缺少生命体验。

这些评价看似老生常谈，却恰恰触及了AI写作和能力最核心的边界。

今天的大模型已经学会如何写一篇正确的作文。它知道什么样的开头容易得分，什么样的结构更完整，什么样的论证更符合评分标准。

但它并没有真正经历过作文里所描述的人生，AI最大的短板并非文笔，而是主体性。

它可以描述离别，却没有离别的记忆；可以描写成长，却没有成长的体验；可以讨论梦想，却没有属于自己的梦想。它拥有知识，却没有经验；拥有语言，却没有人生，而这恰恰也是教育最珍贵的部分。

更深层的来看，AI应试能力越强，越印证了传统教育的评价体系需要重构。

如果说知识获取正在被AI大幅降低成本，那么真实体验、价值判断、独立思考和创造性表达，反而会变得更加重要。

这或许也是为什么越来越多教育工作者一直在思考一个问题：当AI能够写出标准答案时，教育究竟应该培养什么样的人？关注AI大模型能力边界的从业者，也不过是希望明晰一个确切的目标方向。

AI教育议题的两端：

从高考作文到高校扩招

高考在"考态度"，大学在"培养人"，同一个AI议题的两端已经接通。

今年三套卷子考AI的底层逻辑是一样的。考生能不能对一个AI时代的问题，给出有"人味"的思考和态度？这是高考端。

另一端，2026年高考前，西安交大新增"具身智能"、"数据科学"，扩招360人全部投向AI和集成电路；北京师范大学获批全国首个"人工智能教育"本科专业；华南理工大学开出AI先进技术拔尖班，双院士领衔，本博贯通。超过600所高校开设了AI专业方向。

这不是巧合。高考用作文题告诉社会AI是这一代人绕不开的问题，大学同时用扩招计划回答绕不开的问题需要什么样的人来解决。

两条线在同一个时间窗口合拢了，高考筛选态度，高校培养能力。

与此同时，扩招的不是会用AI的人，而是能造AI的人，这中间有一道隐性分水岭。

仔细看今年高校AI扩招的名单，扩的是集成电路、具身智能、仿生智能机器人、数据科学——全是"硬核AI"，不是"AI应用"。

这和高考作文正在发生的变化相契合。高考作文不再考"会不会写标准答案"（那是AI的长项），转考有没有独立思辨（那才是人的长项）。高校同理，不是扩招更多"会调参"的人，而是要能定义问题的人。

高考作文坚持考"你有没有活过、想过、感受过"，不是保守，是远见。因为AI时代淘汰的是除了会用AI，没有其他东西的人。

高考正在用作文题守住一个底线：不管考生将来学不学AI、进不进这个产业，教育首先得培养的是一个独立思考的人。

阅读(4689)
点赞
评论

点赞
评论

推荐文章

: 2024 SEE 大会：融合多元智慧，共谋教育常青

行业洞察

: 教育部：进一步加强全国职业院校教师教学创新团队建设

教育热点

: 直营校100余家，年在读学员超20万！重磅预告硬核校区总部实地参访路线！

教育热点

: 上海市成协培训机构专业委员会举办“2023年教育培训发展论坛”

教育热点

: 作为校外培训机构的管理人员，怎样制定合理的教师薪酬体系和福利政策？

办学必修

: 惊！这家留学机构要纳斯达克上市，还上调 IPO 规模？

教育热点

发表评论

: 登录后评论

登录教育界网

用户注册

重置密码

提示用户信息

返回顶部

教育界网

登录