OpenAI发布o3与o4-mini推理模型，可自动缩放及旋转图像以协助推理_青世界

OpenAI发布o3与o4-mini推理模型，可自动缩放及旋转图像以协助推理

OpenAI 美元其他高端十轮网科技资讯

更新于：2025-04-18 07:36:57

OpenAI在周三（4/16）发布了全新的o3推理模型与轻量的o4-mini推理模型，这两个新模型最大的特点是具备视觉推理与图像操作能力，将图像纳入推论过程并对其进行多步骤的视觉分析，可自动对图像进行缩放、旋转及剪裁等操作。

o系列是OpenAI的推理模型，强调具备关联性思考能力，但它们在回答之前会思考更长的时间，在回复使用之前采用了很长的内部思考链。OpenAI是在去年9月正式发布o1，也有轻量级的o1-mini与专业级的o1-pro；OpenAI跳过了o2型号，并在今年2月率先发布o3 mini；于本周同时发布o3与o4 mini。

o3与o4 mini最令人惊艳的应该是它们的图像思考及推理能力，这两个模型可借由各种工具来转换用户所上传的图像，让这些图像得以裁剪、放大与旋转，还能执行其他简单的图像处理技术。

例如当用户上传了一张今天在海边拍的照片，远方的海面上有许多船只，他将照片上传并询问最大艘的船只叫什么名字，以及它之后会停靠在哪个港口。由于船只太远，o3只好先将照片放大，识别出用户的位置，找到最大艘的船，识别船只的名字，再上网搜索以给出答案，但总计花了好几分钟。

OpenAI表示，用户可以上传白板的照片、教科书图表或手绘的草图，就算是图像模糊、颠倒或品质不佳，模型还是可以通过工具动态地处理图像，当作它推理的一部分。

图片来源／OpenAI

除了图像推理能力之外，OpenAI o3担当该公司目前最强大的推理模型，不管是在程序代码、数学、科学与视觉感知上都有所进步，强调适合需要多方面分析的复杂查询，根据外部专家的评估，它在困难的现实任务上所犯的重大错误比OpenAI o1少了20%。

OpenAI比较了o3、o4-mini、o1与o3-mini在解决数学问题、高端科学问题、多模态推理能力、程序代码任务，以及指令遵循上的表现，皆可发现o3与o4-mini明显优于前一代的产品。

o3每输入100万个Token的价格为10美元，输出100万个Token的价格为40美元；o4-mini每输入及输出100万个Token的价格，则分别是1.1美元及4.4美元。

Firebase Studio开放预览，加速全端应用开发流程

Firebase Studio开放预览，加速全端应用开发流程

2025-04-13 10:43:11

YouTube推出AI音乐助手创作者可免费生成无版权音乐

YouTube推出AI音乐助手创作者可免费生成无版权音乐

2025-04-13 14:55:56

Windows 95开机声入选美国会声音典藏 Minecraft音乐也入选

Windows 95开机声入选美国会声音典藏 Minecraft音乐也入选

2025-04-14 11:30:07

距离地球仅百光年的系外行星K2-18b，发现迄今最有力外星生命迹象

距离地球仅百光年的系外行星K2-18b，发现迄今最有力外星生命迹象

2025-04-17 17:05:35

地面铺“木地板和瓷砖落伍了”，发现上海一户人家，那才叫高级

地面铺“木地板和瓷砖落伍了”，发现上海一户人家，那才叫高级

2025-04-18 20:49:48

超前卫设计外形 Jaguar Type 00概念车亮相巴黎时装周

超前卫设计外形 Jaguar Type 00概念车亮相巴黎时装周

2025-03-24 11:40:57

C1封装结构与高通X71M数据芯片相似，iFixit拆解iPhone 16e

C1封装结构与高通X71M数据芯片相似，iFixit拆解iPhone 16e

2025-03-24 11:41:31

第二份收入成必要，美国高薪副业排行榜一次看

第二份收入成必要，美国高薪副业排行榜一次看

2025-03-24 11:42:47

《暗黑破坏神：永生不朽》3.3版剧情设计师专访全新职业与未来的无限可能

《暗黑破坏神：永生不朽》3.3版剧情设计师专访全新职业与未来的无限可能

2025-03-24 11:42:50

NVIDIA推出DGX Spark和DGX Station，个人买得起的AI超算时代来临

NVIDIA推出DGX Spark和DGX Station，个人买得起的AI超算时代来临

2025-03-24 11:44:29

去年海平面上升超过预期，科学家：海水上涨才刚开始

去年海平面上升超过预期，科学家：海水上涨才刚开始

2025-03-24 11:44:35

地球早就超载？芬兰研究地球早超过百亿人

地球早就超载？芬兰研究地球早超过百亿人

2025-03-24 11:44:40

iOS 19六月亮相，可以期待哪些新改变？

iOS 19六月亮相，可以期待哪些新改变？

2025-03-24 11:44:40

Pixel 9a内存8GB RAM仅能跑“超超小”Gemini AI，部分AI功能惨遭阉割

Pixel 9a内存8GB RAM仅能跑“超超小”Gemini AI，部分AI功能惨遭阉割

2025-03-24 11:44:40

报告称苹果可折叠iPhone显示屏幕无明显折痕

报告称苹果可折叠iPhone显示屏幕无明显折痕

2025-03-24 11:45:20

AI功能延迟引发争议，苹果陷入虚假广告诉讼

AI功能延迟引发争议，苹果陷入虚假广告诉讼

2025-03-24 11:45:20

全球半导体曝光设备王者ASML，最初在一个漏水棚子中开始

全球半导体曝光设备王者ASML，最初在一个漏水棚子中开始

2025-03-24 11:45:20

Meta AI部分功能在欧盟上线

Meta AI部分功能在欧盟上线

2025-03-24 11:45:20

最新4K显卡性价比排行榜出炉！AMD表现突出，RX 9070 XT被评“真香”

最新4K显卡性价比排行榜出炉！AMD表现突出，RX 9070 XT被评“真香”

2025-03-24 11:50:42

新研究揭示中子星的诞生质量，挑战传统理论

新研究揭示中子星的诞生质量，挑战传统理论

2025-03-24 11:50:42

iPhone 17 Pro系列大升级：全镜头4800万像素、12GB内存加持！

iPhone 17 Pro系列大升级：全镜头4800万像素、12GB内存加持！

2025-03-24 11:50:44

苹果AI功能延误引发集体诉讼消费者指控广告误导要求赔偿

苹果AI功能延误引发集体诉讼消费者指控广告误导要求赔偿

2025-03-24 11:50:46

加州理工学院科学家开发新一代光子计算机，速度超过100GHz

加州理工学院科学家开发新一代光子计算机，速度超过100GHz

2025-03-24 11:57:09

解构Apple最新自家制芯片、新科技改变iPhone使用体验

解构Apple最新自家制芯片、新科技改变iPhone使用体验

2025-03-24 11:57:54