当前位置: 首页 >
如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 人气:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-29自己组一个E5服务器才几百块钱,为什么去阿里云租这么贵?
- 2025-06-29匿名说一下你最近的烦恼吧?
- 2025-06-29广西,如何才能发展起来?
- 2025-06-29哪个ai写代码最强?
- 2025-06-29新手养鱼,鱼缸中能放入哪些水草?
- 2025-06-29为什么很多时候对女儿最狠的却是母亲?
- 2025-06-29小米Yu7的超预期大爆是否会促使华为亲自下场造车?
- 2025-06-29你被哪个后来知道很sb的BUG困扰过一周以上吗?
- 2025-06-29大家比较关心成飞6代,而不关心沈飞6代?是不是已经默认沈飞6代机不行?沈飞6代机外形更像战斗机?
- 2025-06-29什么是你去了台湾才知道的事?
- 2025-06-29为什么中国开发不出流行的编程语言?
- 2025-06-29为什么公务员晋升要卡年龄?
- 2025-06-29怎么评价Jeremy Brett扮演的福尔摩斯?
- 2025-06-29伊朗这样被严重渗透的国家应该怎么办?
- 2025-06-29马景涛这些年到底经历了什么?
- 2025-06-29现在个人博客不能备案了吗?
推荐产品
-
为什么程序员独爱用Mac进行编程?
以前只是因为UI设计好看,我觉得单为这牺牲兼容性不值得。 -
男朋友说我穿衣服太开放,难道好身材不应该显示出来吗?
某天在公园健身区,看到一个五十多岁的大妈身穿紧身瑜伽裤在拉伸 -
用K8s的公司有多少人会部署K8s?
“Kubernetes 并不会主动摧毁你的服务,但它会在你没 -
中央多份重磅文件出台,密集释放「涨工资」「提高居民收入」的信号,这背后有何深意?
这样说吧,2025年2月,我和亲戚聚餐的时候,我说我判断3年
最新资讯




