国外的女生为什么屁股都大?
大家知道为什么艺术家都喜欢画女人体吗?
中国大陆地区献血率为何如此低下?
为什么苹果手机杀后台现象频繁?是内存不够、后台管理严格还是其他原因呢?
为什么大部分人都认为2560x1440是2K?
有哪些动物看上去比较弱,没有毒,也不是没肉可吃,但食肉动物一般不吃它?

OpenAI 推出 o3-pro 推理模型,实际体验如何?

发布日期:2025-06-22 11:40:11 浏览次数:0

两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。

一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。

半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。

然后今年,o3、o4-mini、gemini 2.5 pro……终于…。

OpenAI 推出 o3-pro 推理模型,实际体验如何?