反超Nano Banana！OpenAI旗舰图像生成模型上线

OpenAI 的红色预警，还在发力。

憋了大半年的图像生成模型——GPT-Image-1.5，终于发布。

据官方表示，本次更新主要有四个亮点：

更严谨的指令遵循；

精确编辑；

细节保留；

速度比以前快 4 倍。

感觉……这是要全面对标 Nano Banana 了啊。

目前的玩法也很类似。比如，将汽车颜色改为橙色。

拯救这个被烤焦的饼。

根据奶昔架、芝士汉堡等元素，做一个复古风格的餐馆广告。

指令遵守和精确编辑方面，的确比之前强了不少。

而且今天就能用上了，GPT-Image-1.5 将在 ChatGPT 中面向所有用户推出，并在 API 中作为 GPT Image 1.5 推出。

OpenAI 最强图像生成模型

被谷歌一轮正面「拷打」之后，OpenAI 藏了大半年的 GPT-Image-1.5，终于憋不住了。

这个旗舰级图像生成模型，主打精准编辑、细节保留，图像生成速度最高提升 4 倍。所有改进，都指向同一个产品理念——实用性。

编辑图像时，GPT-Image-1.5 对指令的遵循更加严谨：光照、构图、人物外观等关键要素，能够在输入、输出及多轮编辑中保持高度一致。

例如：生成一张 2000 年代胶片相机风格的照片，画面中两名男子和一条狗出现在孩子的生日派对上，神情略显无聊。

在不改变原始画面结构的前提下，还可以「加戏」，邀请一群小朋友入镜捣蛋，整体风格与细节依然能保持一致。

在图像风格层面，真实感也有了明显提升。比如下面这个 Prompt：

拍摄一张 20 世纪 70 年代伦敦切尔西的场景照片，画面要逼真，所有景物清晰对焦，人群密集，还有一辆公交车，车身贴着「ImageGen 1.5」的广告，广告上印有 OpenAI 标志和「创造你的想象」的副标题。整体风格像业余摄影作品，iPhone 快照画质……

左边是新模型，右边是旧模型，差距还是挺明显。

即便是更偏创意的任务，同样能够稳定保留关键信息与人物特征。

根据这两位男士的图片，制作一张名为《Codex》的好莱坞黄金时代电影海报。演员姓名改为 Wojciech Zaremba（左）和 Greg Brockman（右），由奥特曼执导，菲吉 · 西莫制片，AGI 影业出品。

创作一张深海生物在不同深度的海报，采用垂直海洋剖面图，风格为精美细致的日式动漫风格。

前段时间，Nano Banana 在答题卡上写「小作文」的能力火爆全网。GPT 也能实现了。

这次，GPT-Image-1.5 在文本渲染上进步明显，能够处理更密集、更小字号的文字。甚至可以根据给定资料，直接把 GPT-5.2 的技术报告做出来了。

除了模型能力的升级，产品形态也随之调整。

OpenAI 在 ChatGPT 中新增了专门的图片板块，内置数十种滤镜与 Prompt，可通过 App 侧边栏或官网直接访问。

来到 Benchmark 环节，自然少不了「秀肌肉」。

评测机构 Artificial Analysis 指出，GPT-Image-1.5 在文本转图像和图像编辑方面中均位列第一，超过 Nano Banana Pro。

不过，在更强调精细化图像编辑能力的 GenAI Image Editing Showdown 中，GPT-Image-1.5 仍未能反超谷歌。

但值得注意的是，其指令遵守率高达 90%，断层式领先。

按照 OpenAI 的说法，该模型将于今日起面向全球所有 ChatGPT 用户与 API 用户全面开放。

定价方面，GPT-Image-1.5 的 API 相较上一代 GPT Image 1，输入与输出成本整体下降 20%。

具体价格因分辨率而异：

高质量图像约为每千张 133 美元；

低质量图像约为每千张 9 美元。

不得不说，这波谷歌立大功。（doge）

世界理解，还得看香蕉？

「精细编辑 + 降价」，OpenAI 这次，看来是铁了心要把图像功能推向生产力工具。

新模型发布后，曾任微软 AI 副总裁、现就职于 OpenAI 的Sebastien Bubeck也第一时间下场，为 GPT-Image-1.5 站台。

但质疑也随之而来。

有网友指出，GPT-Image-1.5 在「理解世界」这一层面，似乎仍不如 Nano Banana：

问题太多了。左边球体中的「线」是由三个不相连的环组成，每个方程式都有错……像是在凭感觉做数学题？

对此，Sebastien Bubeck 解释道：

这只是做着玩的，如果是正式海报，肯定会在此基础上迭代。

事实上，对 GPT-Image-1.5 世界理解能力的质疑，并非个例。

AI 社区的知名「内部」人士，Jimmy Apples在评测后直言：

相比上一代提升很大，但不如香蕉聪明。

具体而言，他认为：如果只是创意性工作，影响不大；但如果是做 PPT，GPT-Image-1.5 给出的图片可能会有信息错误。

Nano Banana 感觉更像一个世界模型。

参考链接：

[ 1 ] https://x.com/ArtificialAnlys/status/2001016199094948185?s=20

[ 2 ] https://x.com/SebastienBubeck/status/2001038641469194588?s=20

[ 3 ] https://x.com/apples_jimmy/status/2001053915278926228?s=20

[ 4 ] https://genai-showdown.specr.net/image-editing

[ 5 ] https://openai.com/index/new-chatgpt-images-is-here/

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

点亮星标

科技前沿进展每日见

宙世代

一起剪

相关标签