5位AI界“考生”参加高考作文写作，最高分竟然是...

随着一年一度高考的帷幕缓缓降下，如同往昔，各省高考作文命题迅速成为了社会各界热议的焦点。高考作文命题历来紧扣时代脉搏，而今年新课标I卷则直接聚焦于当前最为炙手可热的领域——“人工智能”。

阅读下面的材料，根据要求写作。（60分）

随着互联网的普及、人工智能的应用，越来越多的问题能很快得到答案。那么，我们的问题是否会越来越少？

以上材料引发了你怎样的联想和思考？请写一篇文章。
要求：选准角度，确定立意，明确文体，自拟标题；不要套作，不得抄袭；不得泄露个人信息；不少于800字。

借此契机，我们决定让人工智能亲自参与到这一考试中来。本次考试我们邀请了五位在AI界享有盛名的“考生”——ChatGPT、Kimi、文心一言、通义千问，以及智谱清言，来挑战这一高考作文题。不仅要求它们各自提交一篇作文，同时让这些AI相互评价，看看在AI的角度谁才是“高考”中的“优秀作文”。

一、各显神通

为了公平起见，本次测试我们将不添加任何额外的Prompt修饰，直接使用高考题目进行提问。每篇由AI撰写的作文后，会附上其余几位AI同伴的评分及它们各自的评判理由。

➢月之暗面——Kimi

接下来，让我们看看各位评委给出的本篇文章评分。

ChatGPT评分

文心一言评分

通义千问评分

智谱清言评分

Kimi自我评价

综合以上5个分数，Kimi的平均分是55.8。

可以看出Kimi给出的文章还是有一股我们常说的“AI味”，频繁使用诸如“首先”、“其次”、“综上所述”等程式化的过渡词汇，这种模式化的语言习惯往往被我们视为识别AI写作的直观线索，并没有完全贴合我们所说“高考作文体”。

➢百度-文心一言

接下来，让我们看看各位评委给出的本篇文章评分。

ChatGPT评分

Kimi评分

通义千问评分

智谱清言评分

文心一言自我评价

综合以上5个分数，文心一言的平均分是57.2。

本篇文章的分数要明显高于Kimi的表现，行文上也一定程度上矫正了我们刚刚提到的“AI味”，整体叙述更符合高考作文所需要的议论文格式。但就像各个评分中所说，文心一言给出的文章更多是论点的输出，缺乏了一定的论据支持。

➢阿里-通义千问

照例给出各位评委的文章评分。

ChatGPT评分

Kimi评分

文心一言评分

智谱清言评分

通义千问自我评价

综合以上5个分数，通义千问的平均分是58.8。

毫无疑问，通义千问的这篇文章受到了来自各家AI评委的一致好评，除ChatGPT之外，其他三个AI评委均给出了59的高分。回顾一下通义千问给出的这篇文章，不难发现其成功之处在于不仅条理清晰地阐述了核心观点，并辅以有力的证据支撑，更巧妙融合了名言引用、排比句式等多种修辞手法。在去除"AI“味的同时，最大程度上接近了我们“人“的作文写作形式。

➢智谱清言

接下来，让我们看看各位评委给出的本篇文章评分。

ChatGPT评分

Kimi评分

文心一言评分

通义千问评分

智谱清言自我评价

综合以上5个分数，智谱清言的平均分是56。

相比较前几篇文章，智谱清言给出的这篇文章要稍显逊色。文中与Kimi一样频繁采用了格式化的过渡语句，导致文章整体流于机械化。同时对于主题的探讨大多停留于浅层，缺乏深入剖析和具体实例的支撑，论点显得空泛而不够扎实。从各个评委的评分也能看出，大家对于本篇文章的认可度较低。

➢OpenAI—ChatGPT

唯一的一位“外籍”考生所作的作文，我们看看各位评委给出的评分。

Kimi评分

文心一言评分

通义千问评分

智谱清言评分

ChatGPT自我评价

综合以上5个分数，ChatGPT的平均分是56.6。

作为唯一一个“外籍”考生，小编对于ChatGPT的文章其实是抱有一些期待的，毕竟要学好中文可不是一件简单的事情。从各个AI评委的评分来看，对于ChatGPT的本篇文章评价较为中规中矩，兼顾了议论文基本的论点与论据，但是在部分论据的使用上过于简单，未能深入，同时缺乏实际案例，更多是假设类例子表达，一定程度上偏离了高考的标准。