设为首页|收藏本站|
开启左侧

[科技] 大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o

[复制链接]
70529 0
鸡毛掸子 发表于 2024-5-27 15:30:25 | 只看该作者 打印 上一主题 下一主题
 
又是一年高考时,除文作文题目,其他的题你还能看懂嘛?
你也许不懂,但大模型可以!
随着人工智能技术的飞速发展,人工智能AI在各个领域的应用越来越广泛,“大模型做高考题”也成了一大看点。
虽然大模型“重文轻理”是普遍情况,但也有大模型主攻数学能力。今天的测试,让专攻数学的国产九章大模型(MathGPT)和GPT-4o一起做今年的数学题,以2024全国甲卷数学高考真题为例,看看结果会怎样?
一、先说结论
【九章大模型(MathGPT)】
选择题12题,做对7题。
填空题4题,做对2题。
九章大模型总分 = 7 * 5分 + 2 * 5分  = 45分 (满分90分)
【GPT-4o】
选择题12题, 正确7题。
填空题4题, 正确1题。
GPT-4o总分 = 7 * 5分 + 1 * 5分  = 40分 (满分90分)
九章大模型作为以数学领域的解题和讲题算法为核心的大模型,在高考数学题目上更胜一筹,比GPT-4o得分更高。同时“点睛”分析也是九章大模型的特色,在解题的同时还拆解了题目的考点,更适合给学习者参考。
但从绝对值的分数来看,两个大模型的整体答题分数都不算太高。大模型做数学题仍是一个难度较大的挑战,短期的模型表现还达不到完美,但在逐步攻克数学问题的路上,AI的每一步尝试进展,都是对未来教育的想象空间的开拓,值得更多耐心与期待。
二、测试方法说明
1、测试题目:2024年高考全国甲卷数学真题
2、数学解答题的评分考核步骤过程,答题准确与否不易评判,所以只针对有明确答案的选择题和填空题来测试。
3、在测试中我们发现,文本输入格式的不同,会对测试结果造成比较明显的干扰。于是此次测试采用了上传图片文本识别的方式,让大模型识别题目并做题,更能保证结果的公平客观。同时,这种识图的方式也更类似“人类视觉读题”的情况,是对大模型能力的全面考验。
三、选择题,九章大模型、GPT-4o互有胜负
2024年高考全国甲卷数学题共12道选择题,九章大模型和GPT-4o都是有7道正确,但做对的题目不完全相同,互有胜负。
具体来看几道题:
第2题,九章大模型做对,GPT-4o做错:
原题:
大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o 第1张图片


九章大模型解答:
大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o 第2张图片


GPT-4o解答:
大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o 第3张图片


第9题,九章大模型做对,GPT-4o认为没有正确答案:
原题:
大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o 第4张图片


九章大模型解答:
大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o 第5张图片


GPT-4o解答:
大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o 第6张图片


第10题,九章大模型做错,GPT-4o做对:
原题:
大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o 第7张图片


九章大模型解答:
大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o 第8张图片


GPT-4o解答,答案选择正确,但其中解题对命题①的分析存在错误:
大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o 第9张图片


四、填空题,GPT-4o做对一道,九章做对两道
具体来看两道题:
第14题,九章大模型和GPT-4o都做对:
原题:
大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o 第10张图片


九章大模型解答:
大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o 第11张图片


GPT-4o解答:
大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o 第12张图片


第16题,九章大模型做对,GPT-4o做错:
原题:
大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o 第13张图片


九章大模型解答:
大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o 第14张图片


GPT-4o解答:
大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o 第15张图片


关于GPT-4o
2024年5月14日,OpenAI宣布推出GPT-4o,GPT-4o在处理速度上提升了高达200%,GPT-4o所有功能包括视觉、联网、记忆、执行代码以及GPT Store等,可以实时对音频、视觉和文本进行推理。
关于九章大模型
学而思九章大模型(MathGPT)是学而思自主研发的,面向全球数学爱好者和科研机构,以解题和讲题算法为核心的大模型。2023 年 11 月,九章大模型成为首批通过备案的教育大模型。


上一篇:刘姝威再谈柔宇:刘自鸿曾拒绝离开管理层,错失机会拯救公司
下一篇:重庆物业服务收费统一实行指导价
@



1.西兔生活网 CTLIVES 内容全部来自网络;
2.版权归原网站或原作者所有;
3.内容与本站立场无关;
4.若涉及侵权或有疑义,请点击“举报”按钮,其他联系方式或无法及时处理。
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

排行榜
活跃网友
返回顶部快速回复上一主题下一主题返回列表APP下载手机访问
Copyright © 2016-2028 CTLIVES.COM All Rights Reserved.  西兔生活网  小黑屋| GMT+8, 2024-9-15 06:55