当前位置: 首页 >

正文

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。

这是第五题的原题,正确答案是A. - 1/2。

这是之前的第三方的测试结果,6个模型…。

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

2025-06-22 22:20:12浏览:99次
电话:
客服QQ:
邮箱:
萨克斯在行政命令签署当天早上直接致电特朗普,警告白宫拟推出的AI审查机制将严重拖慢美国AI产业创新速度,甚至导致美国在AI竞争中输给中国。多名知情人士透露,两人与特朗普通话时警告称,这套审查机制可能阻碍美国…
刚赚了创纪录的钱,转头就裁8000人,小扎要用AI重写Meta_员工_团队_岗位
小米MiMo团队近期的动作引发了外界广泛好奇,而这种关注与团队在产品侧和论文发表的「高节奏推进」密不可分。 董谨豪,中国人民大学信息学院/数据工程与知识工程教育部重点实验室讲师,同时也是小米大语言模型(LL…
5月27日,抖音生活服务举办 “服务体验与治理开放日”,直面行业共性问题,系统分享服务升级与生态治理成果
查看所有文章