OpenAI联合创始人兼首席执行官萨姆·奥尔特曼。图片来源:Taylor Hill—FilmMagic
OpenAI发布了两款号称“迄今最强大”的AI推理模型,以及一款辅助编程的开源AI智能体,试图在竞争激烈的AI领域维持其领先地位。
这款名为Codex CLI的开源编程智能体,是OpenAI自2019年以来首次推出的重要开源工具。
另外两款新模型分别是其o3模型的完整版本(被OpenAI称为最先进的AI系统),以及一个体积更小但更高效的o4-mini模型。
OpenAI总裁格雷格·布罗克曼在周三的新品发布会上表示:“这是首批被顶尖科学家认可能够真正产生有价值、有创新性的想法的模型。”
这些模型将即刻向付费用户开放,包括ChatGPT Plus和Pro服务的订阅用户,以及使用企业版Teams和API产品的机构。
此次新模型的发布正值OpenAI维持AI领域领先地位面临压力的时刻。今年早些时候,中国公司深度求索(DeepSeek)打破了人们对OpenAI等美国AI实验室长期技术领先的这一固有认知。深度求索的R1模型不仅具备OpenAI o系列模型的“思维链”推理能力,更凭借其开源特性(可免费下载和轻松定制)赢得众多企业青睐。相较之下,OpenAI的多数模型只能通过专有应用程序编程接口(API)付费访问。
与此同时,OpenAI还面临其他闭源模型提供商更加激烈的竞争。2月,AI公司Anthropic率先推出一款模型,既能快速提供类似直觉反应的回答,也能根据提示语要求进行“思维链”逐步推理。这种动态决定何时需要推理和何时需要更快提供回答的能力,正是OpenAI尚未攻克的难题。上个月,谷歌(Google)发布了Gemini 2.5 Pro推理模型,在多项基准测试中击败了OpenAI的o3-mini模型。
周三,OpenAI试图重新夺回在推理模型领域的领先地位。OpenAI宣称其o3和o4-mini模型现已在多项基准测试中领先,尽管这些结果尚未获得第三方验证。该公司还宣称,其模型能够自主调用其他软件工具,如网页浏览、编程环境等,无需用户特别给出指令。
OpenAI在周三的直播中演示了o3模型的能力。研究人员展示了o3模型在分析2015年一份物理研究海报的照片后,自主进行网页搜索,查找更多最新相关研究并对比研究结果。他们还展示了模型自主决定运行Python代码解决数学和编程难题的场景。
OpenAI表示,o3和o4-mini模型可直接对草图、图表甚至模糊的低质量照片进行视觉推理,并能在推理过程中操作图像处理。
而Codex CLI编程智能体设计为本地运行,通过云端接入o3和o4-mini模型进行推理,同时支持调用其他本地部署的软件工具。Codex CLI不仅能建议代码片段,还能自主选择使用不同工具来完成任务。
公司还透露,Codex CLI即将可以使用本周早些时候发布的GPT-4.1模型的功能。
为鼓励开发者使用Codex CLI,OpenAI设立了100万美元基金,将为有潜力的项目提供价值2.5万美元的API积分支持。
OpenAI表示,训练o3模型所使用的算力是前代最强推理模型o1的10倍。(财富中文网)
译者:刘进龙
审校:汪皓