讯飞星火高考中英文作文双料第一,力压GPT-4o

随着2024届高考落幕,近日,各家大模型的高考评测结果陆续出炉,多家媒体和专业人士用高考中英文作文题和数学题对大模型能力进行测评,讯飞星火不仅占据榜首,并超过GPT-4o,在本届的“大模型高考”中,讯飞星火多学科综合能力领先。

作为去年高考大模型数学能力测评的“扛把子”,在本届的高考数学能力评测中,讯飞星火依旧能打,实力捍卫“最强理科生”地位。数学考试结束后,在搜狐科技针对国内十余家大模型的高考数学能力评测中,讯飞星火、文心一言、豆包均以63%的正确率位列第一梯队,智谱清言、阿里通义则以50%的正确率位居第二梯队,其他大模型相对落后。

在另一家教育类科技媒体的评测中,讯飞星火的数学能力依旧能打。一家教育类科技媒体“多鲸”选取北京数学卷——新高考一卷的倒数第二题(导数题),向海内外4个大模型进行了提问:ChatGPT-4o、Google Gemini-1.5、学而思九章大模型(MathGPT)、讯飞星火、ChatGLM-4 (智谱清言),提问包括原始题目和对结果的打分。在最终的评测结果来看,讯飞星火不仅给出了详细的解题步骤,对比其他家大模型,还给出了更详细的考点和对应知识点分析,在这一点上,讯飞星火是更贴合考生的“备考搭子”,考生可以将讯飞星火作为平时复习的AI辅助工具。实际上,科大讯飞早已将星火大模型的这项能力应用在了AI学习机的精准学功能中:搭载讯飞星火V3.5的学习机,可以通过几道题精准找到孩子学习薄弱点,给出专属学习路径帮助孩子掌握相应知识点。

作为高考开考的第一科,各地高考作文题目每年都是全民热议话题。在《科普中国》的一篇评测文章中,选取三家国内最常用的“AI”各写了一篇作文,并委托一位高中语文教师做了点评。最终,AI考生讯飞星火“小飞”同学拿下46分的得分,远超另外两位“AI考生”。

评测的末尾,科普中国还点名表扬了“小飞同学”,认为小飞同学的文章里体现出了“人类学生自己未曾想到的角度”。

看来,讯飞星火的作文能力广受外部认可,达到远超高考语文平均分水平。笔者以今年的新课标II卷作文为例:“长久以来,人们只能看到月球固定朝向地球的一面,“嫦娥四号”探月任务揭开了月背的神秘面纱;随着“天问一号”飞离地球,航天人的目光又投向遥远的深空……正如人类的太空之旅,我们每个人也都在不断抵达未知之境。这引发了你怎样的联想与思考?请写一篇文章。”实测讯飞星火,交出的考卷如下:

河南省基础教育教学专家库成员、河南省学术技术带头人李来明根据高考作文评分标准针对讯飞星火的表现进行了点评:“这篇文章从引入话题,到分层论述,层次分明,论证清晰,符合议论文的写作规范。文章不仅运用了材料素材,还能灵活运用事实论据,表达主旨。文章的语言表达用词较为贴切,句式灵活,文句具有表现力。”最终,李来明给出了50分的评分,大模型考生在高考作文中达到一类文水平。

语文能力堪称AI界“笔杆子”并拿下高分,讯飞星火的数学能力也在此次大模型高考“练兵场”中也表现不俗,捍卫自己“数学最强理科生”地位。

在英语能力测评中,讯飞星火也展现出了多语种方面的实力。今年的北京卷英语作文题目为题目为:“假设你是红星中学高三学生李华。你的外国好友Jim准备给其校报的 Asia Today 栏目投稿。得知今年新中国成立 75周年,他打算重点介绍中国的发展成就,发来邮件询问你的建议。请你用英文给他回复。”有考生走出考场后表示,感觉作文题目有点出乎意料,较平时准备的上了难度,笔者实测讯飞星火交出的考卷如何:

第一眼看上去,这篇英语作文行文流畅,语法准确,结构清晰,应该算是一篇标准的高考英语范文了。

同样放到高考阅卷评分标准里,讯飞星火能拿几分?

资深外语教研专家周国荣点评:

“这篇文章很好地回应了Jim的询问,并介绍了中国几个快速发展的领域。

内容上:作者提及了三方面,即高速铁路、电信技术、可再生能源,涵盖了中国近几年高速发展的重要领域。

语言上:文章使用了较多高级表达,如highlight,demonstrate,significantly等,显示了作者扎实的语言功底。

总体而言,这篇文章较好地完成了写作任务,提供了具体的内容,也展现了作者对中国发展的关注和个人见解。”最终,周老师给出了18分(满分20分)的得分,讯飞星火在高考英语作文中也夺得高分。

由此来看,在这波AI大模型高考“大练兵”中,讯飞星火凭借其优越的语言理解、文本生成、逻辑推理能力,在语文、英语、数学能力中综合表现达国产大模型领先水平,是一位实打实的多学科综合能力第一的“AI考生”。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/702607.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Django之云存储(一)

一、介绍 用户上传的文件以及项目中使用的静态文件,除了保存在本地服务器,还在可以保存在云服务中,比如: 阿里云七牛云(课程选用)亚马逊云等1.1、使用方式 注册账号 七牛云开发者平台 实名认证 创建空间

Unity 集成 FMOD 音频管理插件 2.02

Unity 集成 FMOD 音频管理插件 2.02 3. 集成教程:3.1 设置Unity项目3.2 设置FMOD项目3.3 设置 FMOD for Unity3.4 添加声音:卡丁车引擎3.5 添加声音:氛围3.6 添加声音:音乐3.7 删除现有音频3.8 下一步 10. 脚本 API 参考10.1 基础…

2024年6月12日 (周三) 叶子游戏新闻

万能嗅探: 实测 网页打开 某视频号、某音、某红薯、某站,可以做到无水印的视频和封面下载功能哦,具体玩法大家自行发挥吧。 WPS免登录一键修改器: 去除烦人的登录且能正常使用 杨奇试戴《黑神话:悟空》豪华版金箍 效果还不错!最近…

181.二叉树:验证二叉树(力扣)

代码解决 /*** Definition for a binary tree node.* struct TreeNode {* int val;* TreeNode *left;* TreeNode *right;* TreeNode() : val(0), left(nullptr), right(nullptr) {}* TreeNode(int x) : val(x), left(nullptr), right(nullptr) {}* Tre…

3-哈希表-71-三数之和-LeetCode15

3-哈希表-71-三数之和-LeetCode15 参考:代码随想录 LeetCode: 题目序号15 更多内容欢迎关注我(持续更新中,欢迎Star✨) Github:CodeZeng1998/Java-Developer-Work-Note 技术公众号:CodeZeng1998&#xff…

【人工智能】文本提取技术的算法延伸

✍🏻记录学习过程中的输出,坚持每天学习一点点~ ❤️希望能给大家提供帮助~欢迎点赞👍🏻收藏⭐评论✍🏻指点🙏 文本提取技术中用到的算法 TF-IDF(Term Frequency-Inverse Document Frequency…

数据分类分级,误把起点当终点

数据分类分级 吉祥学安全知识星球🔗除了包含技术干货:Java代码审计、web安全、应急响应等,还包含了安全中常见的售前护网案例、售前方案、ppt等,同时也有面向学生的网络安全面试、护网面试等。 01 — 数据分类分级的定义 数据分…

Tuxera NTFS for Mac 2023软件:超级详细安装步骤(最新版软件下载)

软件简介: 在 Mac 上打开、编辑、复制、移动或删除存储在 Windows NTFS 格式 USB 驱动器上的文件。当您获得一台新 Mac 时,它只能读取 Windows NTFS 格式的 USB 驱动器。要将文件添加、保存或写入您的 Mac,您需要一个附加的 NTFS 驱动程序。…

论文Abstract怎么写

摘要是你要写的最后一项内容 步骤 首先先通读自己的文章,清楚自己写的文章是研究型还是技术型,适合描述性的摘要还是知识性。 描述性摘要内含研究目的、目标及方向等,不讲研究结果。字数大约100-200字。知识性摘要则包含研究结果&#xff0c…

语法05 C++ 浮点型/实数类型

什么是实数类型 实数类型是一种数据类型&#xff0c;实数类型变量里能存放小数和整数。 定义格式&#xff1a;double a; 赋值&#xff1a;a0.4; 输入&#xff1a;cin>>a; 输出&#xff1a;cout<<a; 训练&#xff1a;尺子的价格 小知在文具店买铅笔&#xff…

如何用Vue3构建一个交互式音乐播放器

本文由ScriptEcho平台提供技术支持 项目地址&#xff1a;传送门 Vue.js 开发音乐播放器卡片 应用场景 这款音乐播放器卡片旨在为音乐应用程序提供一个现代而交互式的用户界面。它包含诸如歌曲信息、播放进度条和控制按钮等关键功能。 基本功能 **歌曲信息显示&#xff1a…

The Sandbox 游戏创作比赛|巴黎 CITY JAM

The Sandbox City Jam 邀请大家参与 The Sandbox 全新 Game Jam&#xff1a;City Jam&#xff01;活动将以社区为中心&#xff0c;每次一个城市&#xff0c;旨在将国际文化带入The Sandbox。你可以通过参与比赛赢得奖品&#xff0c;发展技能&#xff0c;并与其他创作者为伴&…

国标GB28181安防视频监控EasyCVR平台级联时上级平台不显示通道是什么原因?

国标GB28181安防视频监控/视频集中存储/云存储/磁盘阵列EasyCVR平台部署轻快&#xff0c;可支持的主流标准协议有GA/T 1400、国标GB28181、RTSP/Onvif、RTMP等&#xff0c;以及支持厂家私有协议与SDK接入&#xff0c;包括海康Ehome、海大宇等设备的SDK等。 有用户反馈&#xff…

【大模型应用开发极简入门】提示工程一:1. 通过context、task、role文本结构设计有效的提示词、 2. OpenAI的提示词任务示例

文章目录 一. chat_completion函数二. 设计有效的提示词1.上下文1.1. 更多细节的上下文1.2. 让GPT改进上下文 2.任务2.1. 提供足够的任务信息2.2. OpenAI的任务示例语法纠正总结TL;DR概要Python转自然语言计算时间复杂度修复Python bug产生python函数 3.角色 了解LLM和OpenAI A…

IEOSE 2024北京国际教育留学海外院校展览会11月举办

IEOSE 2024北京国际教育留学展览会 IEOSE 2024 Beijing International Education and Overseas Study Exhibition 2024年11月15日-11月17日&#xff08;周五-周日&#xff09; 15th-17th November, 2024 北京国家会议中心 China National Convention Ce…

【Three.js】知识梳理十:Three.js纹理贴图

1. 纹理贴图 在Three.js中&#xff0c;纹理贴图是一种将二维图像贴到三维物体表面的技术&#xff0c;以增强物体的视觉表现。纹理贴图可以使物体表面更加真实、细腻&#xff0c;为场景增色不少。 在Three.js中&#xff0c;纹理贴图的加载主要通过THREE.TextureLoader类实现。…

LeetCode | 26.删除有序数组中的重复项

在我接触到这道题的时候想的就是一次遍历&#xff0c;设置两个变量记录当前遍历到的数字和对应原数组应该修改的index&#xff0c;在运行过程中&#xff0c;因为原数组已经是有序的了&#xff0c;只不过会存在重复的数字&#xff0c;但是这些重复的数字也是挨在一起的&#xff…

RT-Thread系统使用STM32H7芯片串口5不工作

使用stm32h743芯片串口5不工作&#xff0c;其他串口都正常&#xff0c;TX5->PC12,RX5->PD2 drv_usart.c里面串口5的TX和RX反了&#xff0c;将TX和RX对调后解决。

opencv学习笔记 -- 如何扫描图像

本节主要解决以下几个问题&#xff1a; 如何遍历图像的每一个像素如何存储opencv的矩阵如何衡量算法的性能查询表是什么并且为何要使用该表 举一个例子 如果是使用RGB的格式&#xff0c;数据格式采用unsigned char来进行储存&#xff0c;则每个像素点有256个不同的值&#x…

如何给自己的项目实现在线测试的接口文档knife4j

配置实现Knife4j在线接口测试文档 为什么要是实现这个东西呢&#xff1f;肯定是对我们有用的&#xff0c;后端主要编写的就是接口&#xff0c;然后我们将接口编写好了之后肯定还是需要进行调试看是否能够正常使用且按照规范返回对应的数据。相信大家测试都是基本上使用的是一些…