如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果，突出了一个政治正确，6款大模型，OpenAI的o3倒数第一，我当时看到的时候就觉得很奇怪，o3好歹也是曾经的一代王者，高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下，因为这道题除了o3，其他的国产模型都答对了。

这是第五题的原题，正确答案是A. - 1/2。

这是之前的第三方的测试结果，6个模型…。

2025-06-22 22:20:12浏览：99次

电话:
客服QQ：
邮箱：

萨克斯在行政命令签署当天早上直接致电特朗普，警告白宫拟推出的AI审查机制将严重拖慢美国AI产业创新速度，甚至导致美国在AI竞争中输给中国。多名知情人士透露，两人与特朗普通话时警告称，这套审查机制可能阻碍美国…

刚赚了创纪录的钱，转头就裁8000人，小扎要用AI重写Meta_员工_团队_岗位

小米MiMo团队近期的动作引发了外界广泛好奇，而这种关注与团队在产品侧和论文发表的「高节奏推进」密不可分。董谨豪，中国人民大学信息学院/数据工程与知识工程教育部重点实验室讲师，同时也是小米大语言模型（LL…

5月27日，抖音生活服务举办 “服务体验与治理开放日”，直面行业共性问题，系统分享服务升级与生态治理成果