返回信息流可以试试马斯克和谷歌的
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8105207同步于 2025/3/1
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
目前火爆的大模型数学计算能力实测
IWhisper#311
2025/3/1镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
心血来潮,想测试一下腾讯元宝,学校本地deepseek,官网deepseek,和ChatGPT的o3minihigh模型。<br><br>测试题目为40届中学生物理竞赛的决赛的一道力学题。<br><br>测试结果:<br>1.o3minihigh思考不到一分钟,得出了最简单的最错误答案<br><br>2.学校本地deepseek貌似无法上传图片,使用pdf上传,解答(思考)到一半直接结束,思考的也是错误的<br><br>3.腾讯元宝思考416秒,第一小题送分题答对,后面基本错误,但有正确的地方<br><br>4.官网思考248秒,第一小题也答对,后面也基本错误,但是和元宝一样,也有正确的地方<br><br>综合来看还是官网厉害一点,学校本地的可能还有点差距,o3minihigh并不擅长