声明:本文源自微信公众号窄播,作者李威,经站长之家授权转载发布。这是《窄播Weekly》第66期,本期聚焦的商业动态是:Google最新AI图像生成模型Nano Banana或将引爆AI图像领域应用革命。

去年此时,若想将照片中人物手中的玩具火车换成玩具飞机,需手动标注火车位置,寻找匹配的飞机图片,再指导AI完成替换。我尝试一小时,结果飞机变形严重,人物手指消失,最终效果仅勉强可用。本周,我交给Nano Banana同样的任务,仅指令”将手中玩具火车换成飞机”,无需准备飞机图片,20秒后便获得完美替换的新照片。火车被精准替换,其他元素无任何干扰,人物手指保持完整。这种体验让我联想到初次使用DeepSeek时的震撼——AI不仅能聊天,还能如此智能。同样,我虽习惯用AI生成图片,却从未见过如此精准的图像编辑能力。DeepSeek凭借深度思考能力展现AI应用前景,Nano Banana则以其确定性图像创作能力,将推动大众更广泛地使用AI处理图像任务。

目前社交媒体涌现大量用Nano Banana制作的手办模型、OOTD换装图,甚至有人将其与视频生成大模型结合创作内容。这并非简单的”吉卜力风格”滤镜流行,而是高效通用图像创作能力的普及,将支撑更多产品创新。未来Gemini及众多产品中或会出现Nano Banana的身影。但这要求模型厂商像Nano Banana一样,从多模态视角综合提升图像创作能力。

谷歌Nano Banana革新AI图像处理技术插图

AI时代的美图秀秀式体验,让人通过一句话实现图像精准调整。这与早期从Photoshop切换到美图秀秀的感受相似:Photoshop需要记忆复杂操作步骤,而美图秀秀只需点击拖拽,无基础用户也能快速上手。Nano Banana让普通用户通过简单指令完成图像精准修改,这是图像创作领域的又一次革命。不同之处在于,Photoshop到美图秀秀是产品思路转变(固定操作变一键完成),而Nano Banana带来的是AI理解图像、编辑图像的能力。

Nano Banana团队介绍,其核心能力源于两个关键点:原生多模态架构与交错生成。多模态架构使Nano Banana能同时处理文本、图像等上下文,获取像素级信息,实现像素级精确编辑。交错生成则将复杂提示拆解为多步骤,逐步完成修改。这类似DeepSeek通过深度思考拆解提示语分步执行,实现高度一致的结果。Nano Banana通过精确理解和细致拆分,达成高度一致的图像编辑,同时保持低成本、高速度。Google介绍其定价30美元/百万token,生成一张图片约1290个token,成本约0.039美元,耗时十几秒至几十秒。快速生成与精确调整的完美结合,支持用户迭代创作,不断接近理想效果。

出色能力催生广泛应用。我的体验显示,Nano Banana能轻松为哪吒换豆豆鞋,生成路飞与艾斯的打斗场面。虽偶有瑕疵(如路飞体型比例问题、调整时无变化),但已证明其作为AI图像应用基础能力的潜力。第一类应用是虚拟试衣,用户可实时预览穿搭效果。第二类应用是内容创作,提高故事板、漫画、儿童读物制作效率,降低商品宣传物料成本,实现一键生成多场景海报。第三类应用是室内设计,用户可随时调整装修效果。第四类应用是图生视频,创作者可精准调整首尾帧,生成更符合预期的视频,或用于换脸等特效制作。这些应用探索的核心是将Nano Banana基础能力与领域隐性知识结合,降低特定图像需求的使用门槛。

谷歌Nano Banana革新AI图像处理技术插图1

虽然Google将Nano Banana集成到Gemini中,但通用助手并非万能。摩根士丹利分析认为,美图价值在于提供AI无法企及的”最后一公里”解决方案。未来这种解决方案将更细分,更专注具体任务。这将激发大量创新,使图像AI应用更专业、更广泛。美图或转型为不同类型图像工具集合,向用户出售隐性知识,而非依赖免费功能吸引用户。

做好Nano Banana是更综合的竞争。Nano Banana团队并非简单开发图像生成模型,而是将多模态能力应用于图像创作。与专注图像生成的Imagen不同,Gemini融合多模态实现AGI目标。面向未来,Nano Banana团队期待模型更具智能感和事实性。智能感指在指令模糊时,模型能生成与现实一致的正确结果;事实性指不仅能创作图像,还能生成准确图标、信息图、示意图甚至PPT页面。这需要依托Gemini世界知识理解多模态上下文,如识别玩具飞机、理解精神小伙穿搭风格等。对Google而言,Nano Banana成功在于搭建起理解与生成协同机制。Gemini图像理解能力帮助大模型从图像、视频中学习世界知识,辅助其更准确理解指令。这意味着不同模型能力融汇贯通,在正确机制下可能实现大模型能力跃升。这不仅是模型集群的胜利,更是企业组织与创新机制的胜利。

最新快讯

2025年11月17日

07:26
英特尔Xeon 654处理器正式亮相Geekbench 6数据库,这款备受期待的处理器隶属于全新Granite Rapids-WS工作站系列,预示着英特尔在高性能计算领域的又一重大突破。作为该系列的中坚力量,Xeon 654拥有18颗物理核心和36条线程,展现出强大的并行处理能力。其三级缓存高达72MB,二级缓存达到36MB,为数据处理提供了充足的缓冲空间。...
07:26
近期,不少Windows 11用户反映在安装微软于11月11日发布的重大更新KB5068861时遭遇失败,系统提示错误代码0x80070306、0x800f0983等问题。此次更新包含63项关键安全补丁,并升级了开始菜单界面、优化了系统性能等多项改进,本应提升用户体验。但实际安装过程中,部分用户发现系统文件检查工具(SFC)无法有效解决冲突,导致补丁安装陷入...
06:52
2025年11月17日,迪拜航展上,波音公司正式公布了其777X飞机项目的最新进展,强调将集中资源推进认证工作,而非积极拓展新订单。这一策略调整,标志着波音在经历重大挫折后,开始将重心从市场扩张转向项目本身的合规性。此前,该公司于10月份投下重磅消息,因项目持续延误,不得不计提49亿美元巨额费用,并将这款全球最大双引擎客机的交付时间推迟至2027年,较原计划...
06:52
2025年7月至9月期间,法国软小麦出口量呈现惊人的增长态势,成为全球粮食市场的一大亮点。数据显示,对非欧盟国家的出口量高达193万吨,较去年同期激增117.86万吨,增幅令人瞩目。与此同时,法国整体出口量也达到了380万吨,较去年同期的208万吨增长了超过80%,这一显著增长充分展现了法国小麦产业的强大竞争力。 此次出口量的大幅提升主要得益于两个关键因素:...
01:20
2025年11月17日,中山大学传来振奋人心的消息,我国首台高能直接几何非弹性中子散射飞行时间谱仪顺利通过验收,标志着我国在非弹性中子散射领域的技术研究迈出了历史性的一步。这台先进的设备能够在百毫电子伏以上能量区间稳定工作,填补了国内相关技术领域的空白,为我国中子科学的发展奠定了坚实基础。 这台被誉为微观世界“超级相机”的先进仪器,具有极高的观测精度,能够精...

2025年11月16日

23:40
2025年11月15日,中环新能源控股集团与美国海明威家族基金会旗下盈智海明威增长收益基金正式签署战略合作协议,共同开启新能源领域的全球合作新篇章。此次合作将充分发挥双方在资源整合、技术创新和市场拓展方面的独特优势,加速推动中环新能源的全球化战略布局,为全球绿色能源发展注入强劲动力。 为深化双方合作,盈智海明威基金及其关联企业已初步计划以产业投资方式认购中环...
23:40
SK启方半导体,作为SK海力士旗下专注于8英寸晶圆代工的核心企业,近日正式宣布完成对SK集团内部碳化硅技术领军企业SK powertech的深度整合,成功迈入高性能SiC晶圆代工这一前沿领域。此次战略整合不仅标志着SK启方半导体在半导体产业链布局上的重大突破,更彰显了其推动下一代功率半导体技术发展的坚定决心。 依托SK启方半导体在先进工艺优化与良率提升方面长...
23:04
2025年11月16日,备受瞩目的第二十七届中国国际高新技术成果交易会在深圳圆满落下帷幕。本届盛会不仅规模再创新高,更在科技创新与产业融合方面取得了令人瞩目的成就。据统计,累计入场人次突破45万,这一数字充分彰显了公众对高新技术成果的浓厚兴趣与高度关注。展会期间,共有5000余项新产品、新技术、新成果集中亮相,为观众呈现了一场科技盛宴。 在成果转化与产业对接...
22:33
广汽集团近日传来喜讯,其下属试验检测中心风洞实验室成功通过中国合格评定国家认可委员会(CNAS)的严格现场评审,正式跻身国家认可实验室行列。这一重要里程碑标志着该实验室在技术能力和质量管理体系上达到了国际顶尖水准。据悉,该实验室严格遵循ISO/IEC 17025:2017国际标准建设,其出具的检测报告不仅获得CNAS权威认证,更具备ILAC国际互认标识,意味...
21:57
育碧公司就《纪元 117:罗马和平》游戏中一张引发争议的AI生成加载界面图像正式公开致歉,承认该图像因审核疏漏被误用于正式版本。尽管游戏在包装和说明中已明确标注“含有AI生成内容”,但玩家群体对图像质量表达了强烈不满。许多玩家指出图像中存在明显的面部扭曲、肢体缺失等典型AI生成痕迹,认为这与3A级大作的定位严重不符,质疑知名游戏开发商不应依赖低劣的AI工具进...
21:57
在美国密苏里州圣路易斯举办的SC25超级计算国际会议现场,全球存储巨头希捷与西部数据同步发布了基于4U架构的百盘位JBOD存储新品,为数据中心提供更高密度、更高效的存储解决方案。希捷此次推出的Exos 4U100与4U74系统,凭借其卓越设计,最高可支持100个3.5英寸硬盘,当搭载Mozaic HAMR技术的32TB硬盘后,单机柜容量可飙升至3.2PB。这...
21:57
2025年11月16日,航空制造业传来振奋人心的消息,波音公司正式宣布其旗舰机型777X已获得美国联邦航空管理局(FAA)的认证测试许可,成功迈入研发进程的关键新阶段。这一里程碑式的突破由波音商业首席执行官亲自确认,不仅彰显了波音在航空技术领域的持续创新,更代表着全球航空业向前迈出了坚实一步。作为全球首款采用复合材料机身的大型宽体客机,777X的研制成功将重...