智东西
作者 | 陈骏达
编辑 | 心缘
Nano Banana 升级了!
智东西 11 月 21 日报道,昨晚 23 点,谷歌发布了其最新一代图像生成和编辑模型 Nano Banana Pro,这是此前爆火的 Nano Banana 的重磅更新。谷歌直接将 Gemini 3 Pro 的推理能力与世界知识库,塞进了 Nano Banana Pro。
Nano Banana Pro 的正式名称为 Gemini 3 Pro Image。基于增强的推理能力、世界知识和实时信息,这一模型可以生成更准确、更具上下文信息的视觉效果。用谷歌的话来说,它不再只是生成 " 像模像样 " 的图像,而是能够真正打造出实用的内容。
谷歌 CEO Sundar Pichai 分享道,Nano Banana Pro 是一款 SOTA 级的图像生成与编辑模型,非常擅长制作复杂的图表,看待世界的方式就像工程师一样。Pichai 分享的案例里,Nano Banana Pro 用实拍和手绘草图结合的方式,讲解了金门大桥的基本结构信息,一目了然。

Nano Banana Pro 的实用性还体现在较强的文字渲染能力上。结合其自带的联网搜索能力,智东西试着让 Nano Banana Pro 打造了一个剪纸风的实时天气卡片。模型不仅找到了正确的天气信息,文字渲染、风格化也是毫无破绽,彻底和上一代 Nano Banana 的 " 鬼画符 " 告别了。

知名科技播客主播 Lex Fridman 专门跑到 Pichai 的评论区,给 Nano Banana Pro 点赞。

目前,Nano Banana Pro 已在 Gemini 应用和 Web 端免费可用,但有一定限额,用完后将恢复到原有的 Nano Banana 模型,Google AI Plus、Pro 和 Ultra 订阅用户可获得更高的配额。
谷歌广告服务、谷歌 Slides 和谷歌 Vids 中的图像生成功能将升级为 Nano Banana Pro。用户也可通过 API 调用、企业订阅方案等使用这一模型。
体验链接:
https://gemini.google.com/
一、外挂谷歌搜索,字体、元素融合玩出花
借助更丰富的知识,Nano Banana Pro 可以制作复杂的教育性讲解图,比如直接生成一份 " 小豆蔻茶 " 菜谱。
可以看到,模型生成的结果不仅文字清晰、毫无乱码,说明步骤也直观易懂;插图与内容配合自然,整体设计风格统一协调。以这样的完成度来说,几乎不需要再做二次编辑。

Nano Banana Pro 能连接到谷歌搜索,帮助用户创建可视化的实时信息,例如天气或体育赛事等等。
下图就是 Nano Banana Pro 自行搜索并打造的波普风格天气海报,上面的信息我们已经核验过了,是完全正确的。

此外,Nano Banana Pro 在文字渲染和多语言方面有了进展。模型现在可以更为深刻的理解图像,感知细节,从而给图像编辑和生成提供了更多空间。
在下面这一案例中,Nano Banana Pro 能根据一张剧照,直接还原出一份手写体的黑板故事板草图,还是带有运镜和故事情节的。

Nano Banana Pro 现在支持更丰富的纹理、字体和书法,能创造更为精细的文字。比如,它就在下图中把 "BERLIN(柏林)" 一词融入了建筑设计,且毫无违和感。

或者是把文字和纹理巧妙地融合在一起,下面的文字上就完美融合了木头横截面的纹理。

书法、字体方面,Nano Banana Pro 的风格是由语义启发的,比如 CRASH 一词的艺术字就有很多裂痕,DRIP 一词就使用了滴落的效果。

借助 Gemini 增强的多语言推理功能,Nano Banana Pro 可以生成多种语言的文本,或者对内容进行本地化和翻译。
下方就是一个英语译韩国语的案例,商品图中不同角度的文字在翻译时都得到了准确的对应。

面向专业创作者的需求,Nano Banana Pro 现在允许用户融合更多的元素,最多可使用 14 张图像,并保持最多 5 位人物的一致性和相似度。下图就是由 14 张输入图像 + 文字提示词打造的,角色一致性得到不错的保持。

这一功能不仅适用于角色,也适用于物体。比如,可以将沙发、绿植和连衣裙和场景等元素一同输入,然后输出全新的场景。

Nano Banana Pro 提供了高级创意控制功能。改进的局部编辑功能现在支持选择、优化和调整图像里的任何部分,比如调整相机角度、改变焦点、应用精细的色彩分级,甚至改变场景光照(例如,将白天变为夜晚或创建散景效果)。

模型现在支持丰富的宽高比调整和 2K、4K 分辨率,让生成结果适用于更专业的场景。

随着 Nano Banana Pro 将虚拟和现实的边界进一步模糊,谷歌打造了一款专用的验证工具,以应对这一挑战。
现在用户可以将照片上传到 Gemini,并要求 Gemini 识别图片是否为 AI 生成。谷歌已经为自家所有的 AI 生成媒体内容配备了 SynthID 数字水印,Gemini 将会据此进行判断。目前,该功能率先支持图片验证,但很快将扩展到音频和视频。
二、多元素一键换装,可 " 拍摄 " 复古老照片
Nano Banana Pro 上线后,已经有海量网友分享了自己的使用体验。
这位网友利用 Nano Banana Pro 打造了四张抓拍照。可以看到 Nano Banana Pro 在运动场景生成的肢体动作不仅没有扭曲,还很有冲击力,而此类场景对大多数图像生成模型来说其实是不小的挑战。这位网友感叹,谷歌真的在改变世界。

Nano Banana Pro 可以用来 " 拍摄 " 怀旧风格的老照片,如果不是网友特别说明,恐怕我们已经很难分辨下面四张图片究竟是真正的老照片,还是 AI 生成的。

同样的风格化能力也能用来复刻游戏的画风,一位日本网友就分享了他打造的像素风游戏角色卡。

元素组合功能对于电商场景来说十分实用。这位设计师分享,自己上传了模特图和衣物图,Nano Banana Pro 便能让模特 " 穿上 " 新衣服,并且融合得很自然。

Nano Banana Pro 的图像编辑能力也可用于优化照片。这位网友将自己实拍的 CyberTruck 交给 Nano Banana Pro 处理,他认为该模型在调整光线、去除瑕疵方面表现很出色。Nano Banana Pro 帮他把竖屏照片扩展为了横屏照片,能直接当壁纸用。

结语:Nano Banana 实用程度获针对性提升
凭借底层模型的升级,Nano Banana Pro 现在让更多普通用户能轻松上手使用图像创作模型,仅依赖简单的提示词就能还原自己内心的想法。
不过,值得注意的是,谷歌在本次升级中的不少方向是在提升模型的实用性。无论更多样的字体,更多的元素,还是高级控制选项,都能给专业创作者以更多选择,打造真正符合其创意的画面。
谷歌已经在积极将 Nano Banana Pro 融入其 To-B 的创意产品,未来该模型能否在商用场景展示真实价值,值得持续关注。


登录后才可以发布评论哦
打开小程序可以发布评论哦