让AI去高考,豆包等四款大模型考上文科“一本”
时间:2024-09-07 03:28:21 来源:<新程序_sjbxin> 责任编辑:耶迪斯·特里贝尔,特里斯坦·勾贝尔,雅基·伊多,安娜·安顿诺威兹,吕斯察德·容兹察夫斯基,Andreas Nickl,Polina Voskresenskaya,亚历山大·谢尔,Hendrik Arnst,Michael Benthin,Tatjana Berges,Angelika Böttiger,Winnie Böwe,Indre Bogdan,Diana Maria Breuer,Julia Franck,卡罗·柳别克,斯特凡·兰帕迪斯

  高考不仅仅是检测国内莘莘学子的一项重要考试,在大模型“百家争鸣”的今天,也是对国内AI大模型的一次考验。

  如果让大模型和国内学子同台竞技,做同一套高考真题试卷,结果会是怎样?

  大模型考上文科本科,豆包获国内头筹

  据介绍,本次评测以新课标Ⅰ卷为考题,与河南省考卷完全相同。

  河南省教育考试院公布的高考录取分数线,文科本科一批分数线为521。根据测试结果,这意味着,GPT-4o、豆包、文心4.0、百小应等四款AI大模型在测试中的得分冲上了“一本”线。

  与文科相比,大模型的理科成绩要差很多,最高分还不到480分,多数大模型的理科总分在400分以下,数学普遍不及格,相比河南理科511分的“一本”线,大模型还需努力。

  文科舒适区,英语具有压倒性优势

  大模型处理自然语言方面的能力不容置疑,三款国产大模型产品获得了语文考试前三名,分别是百小应、字节豆包和腾讯元宝,得分依次为128分、125.5分和120.5分。丢分主要在语文写作上。

  在匿名阅卷中,豆包获得阅卷老师的好评:文章中显出的对就业结构、伦理方面的担心,展现出豆包已经具有不错的思想深度和思辨能力。

  具体看,在立住“问题”后,豆包随即用反问句自然过渡,引出三个排比段提出解决问题的方法。然后用发展的眼光分析问题,结合现实生活揭示问题产生的根源和危害的部分颇为亮点。

  作为本次评测的语文作文阅卷人,北京市级骨干教师、怀柔区语文学科带头人夏老师曾多次参加全国高考语文阅卷。夏老师认为:“Al写出的文章大多有清 晰完整的结构,有逻辑性,语言通顺流畅。但其理性有余,感性不足,缺乏感情色彩,自然就缺乏感染

  在历史和政治两科中,测试选手中有三至四家能达到80%以上的得分率。历史单科的桂冠归属豆包82.5的平均分。出乎意料的是,地理考试是文综三科中大模型表现最差的,最高分仅仅是 GPT-4o的68分。原因之一可能是地理涉及图片更多,AI识图能力有待提升。

  大模型在高考英语测试中的优势更是压倒性的。一张150分满分的英语卷子,平均分达到132分,其中客观题几乎都是满分或接近满分,丢分主要在应用文写作和读后续写的作文部分,表达空泛、缺少细节上是弊端。

  理科“掉链子”,AI有待提升

  如上提到,大模型理科普遍不行,成绩要差很多,在数学、物理、化学等数理学科上差距极大,包括GPT-4o在内的所有大模型都无法达到及格水平。大模型的理科最好成绩还无法进入人类考生的前30%。

  以数学试卷为例,9款大模型产品中,仅GPT-4o、文心一言4.0和豆包获得60分以上成绩(满分150分),目前的大模型只能正确推理步骤相对简单的问题。

  据测试机构透露,豆包等大模型能准确运用求导公式和三角函数定理,但是面对较为复杂的推导和证明问题就很难继续得分。

  重点考查实验探究能力的化学和物理试卷,各模型平均分更是只有34分和39分(满分为100和110)。化学单项最高分由豆包获得,成绩为49.5分,GPT-4o仅有42分。

分为了好几个区域,有的是养殖区,那养殖区中养殖着巴比龙,数头小巧可爱的巴比龙跟随在大巴比龙的身后,不断的叫唤着。

借食材?

他的心神一动,系统空间袋中便是有食材纷飞而出。

整个厨房顿时都弥漫起了泡菜的味道。

魔女安笙目瞪口呆的看着从那一角光门中走出来的步方。让AI去高考,豆包等四款大模型考上文科“一本”小白的眼眸顿时一闪,灰白色光芒顿时一沉。

FUsNZpY665l
相关报道
    分享到:

    中共中央政法委员会主办

    Copyright 2015 www.chinapeace.gov.cn All Rights Reserved 京ICP备 14028866 号-1中国长安网 © 2017版权所有

    石原莉奈无码

    拳交女王周晓淋系列炸草莓

    日出水

    <新程序_随机数><新程序_随机数>.<新程序_随机数><新程序_随机数>MB
    版本V<新程序_随机数><新程序_随机数>.<新程序_随机数><新程序_随机数>.<新程序_随机数><新程序_随机数>
    邪恶军团 安装你想要的应用 更方便 更快捷 发现更多
    午夜在线观看喷水视频
87%好评(<新程序_随机数><新程序_随机数><新程序_随机数>人)
    啪啪啪视频APP 62
    详细信息
    • 软件大小: <新程序_随机数><新程序_随机数>.<新程序_随机数><新程序_随机数>MB
    • 最后更新: 2024-09-07 03:28:21
    • 最新版本: V<新程序_随机数><新程序_随机数>.<新程序_随机数><新程序_随机数>.<新程序_随机数><新程序_随机数>
    • 文件格式: apk
    • 应用分类:ios-Android
    • 使用语言: 中文
    • : 需要联网
    • 系统要求: 5.41以上
    应用介绍
    一,美女不穿衣服APP,日皮软件
    二,妻子配合我淫妻小说
    三,五月天婷婷色综合
    四,男女操逼下载 了
    五,日韩人体艺术
    六,女生啊你tm别舔了
    七,热心的朝阳群众51cgfun.
    【联系我们】
    客服热线:139-2551-646
    加载更多
    版本更新
    V<新程序_随机数><新程序_随机数>.<新程序_随机数><新程序_随机数>.<新程序_随机数><新程序_随机数>
    啪啪啪APP

    猜你喜欢

    包含 饿了么 的应用集
    评论
    • 水野朝阳番号推荐 <新程序_随机数>天前
      天天操夜夜摸
    • 向日葵视频卍 <新程序_随机数>天前
      性巴克APP下载链接
    • 帅气体育生gary视频 <新程序_随机数>天前
      十大污污下载大全
    • 晚上睡不着觉看b站的软件 <新程序_随机数>天前
      糖果传媒mv国产推荐视频
    • 婬妇BBw搡BBBB搡BBBB <新程序_随机数>天前
      免费看黄的软件下载
    • 狼人二三缓冲二三通道 <新程序_随机数>天前
      市来美保
    • 四虎影视澳门皇冠值得信赖 <新程序_随机数>天前
      美图公社
    • 婷丁香 <新程序_随机数>天前
      妺妺窝人体色777777
    • 啪啪啪免费视频 <新程序_随机数>天前
      性巴克免费
    • 深夜福利18禁 <新程序_随机数>天前
      网红吃瓜黑料爆料网