OpenAI最近宣布,将其最新的图像生成技术直接集成进入ChatGPT,通过其新推出的GPT-4o模型,让所有用户、包括免费用户,都能在聊天界面中生成高品质的图像。这一新功能不仅简化了使用流程,还提升了图像生成的品质,能够创建出栩栩如生的图片和可读文本。
这项名为“ChatGPT中的图像生成”的新功能,将在ChatGPT的所有订阅层级中推出,包括Plus、Pro、Team和免费用户。用户将不再需要单独打开DALL-E来创作图片,现在只需在ChatGPT中输入提示,即可生成各种图像。这一功能的强大之处在于,它不仅能够根据用户的提示生成新图像,还能根据上传的文件进行变换,显示出强大的上下文理解能力。
在最近的直播中,OpenAI的首席执行官Sam Altman展示了这一新功能,并强调GPT-4o在创意自由方面的潜力。这一模型能够生成各种图形,包括图表、社交媒体宣传图形以及带有大量文本的图片,让创作者在设计上有更多的自由度。
we are launching a new thing today—images in chatgpt!
two things to say about it:
1. it's an incredible technology/product. i remember seeing some of the first images come out of this model and having a hard time they were really made by AI. we think people will love it, and we…
— Sam Altman (@sama)March 25, 2025
OpenAI还表示,这一新工具旨在满足个人和专业用户的需求,并且在文本渲染和上下文理解上有显著的改进。这使得生成的图像不仅美观,还能更好地反映用户的意图。随着这一功能的推出,OpenAI希望提升用户的创作体验,让图像生成不再只是新奇的玩意,而是实际应用的工具。
用户可以通过简单的对话提示,生成如“中央公园的鸟类海报”或“之前讨论过的艺术史时代的可视化”等图像,展示出GPT-4o强大的多模态能力。这一进展标志着OpenAI在人工智能领域的一次重要飞跃,未来将进一步推动AI技术的应用与发展。
(首图来源:OpenAI)