编者按:本文源自微信公众号白鲸出海(ID:baijingapp),作者赵思尧,编辑殷观晓,经微新创想授权发布。2022年末,OpenAI推出ChatGPT,引发全球对人工智能的认知革命,大量资源与资本随之涌入这一领域。回想起两个月前与一位AI识别创业者的对话,他感慨道:”AIGC这波浪潮不仅催生了新一轮创业热潮,更激发了甲方决策者的热情,似乎不拥抱AIGC就意味着被淘汰。”一个典型案例是,前段时间某国际知名化妆品集团四处寻找一家规模不大的服务商,最终将目光投向了我们,而经过打听发现,这家服务商忙得几乎无暇回复消息。被追捧的主角是zmo.ai,成立于2020年,虽成立时间不长,却已获得多家顶级投资机构的青睐。CrunchBase数据显示,zmo.ai最近一次融资发生在2022年5月,高瓴创投领投,纪源资本和金沙江创投跟投。zmo.ai最受关注的服务是利用AI为时尚品牌生成高质量产品图片。众多品牌积极尝试AI成图,主要源于传统商拍成本高昂且流程繁琐。一个品牌若要制作出效果出色且包含模特的产品图,需提前招募挑选模特、预约拍摄场地与设备,拍摄后还要进行后期处理、筛选和审核,整个流程耗时数天至数周不等,一年中可能需要多次拍摄。根据品牌对成片的要求,费用波动较大。提供AI商拍工具的企业weshop.ai业务负责人吴海波透露,行业内普遍认为,品牌在素材准备上的花费约占年GMV的2%-5%。以年GMV200万美元的电商卖家为例,每年在素材上的投入约为4-10万美元(30-70万人民币),这是一笔不小的开支。理论上,若AI生图服务能替代传统素材且订阅费用低于拍摄成本,便可在市场上获得成功。但现实如何?zmo.ai备受追捧是偶然还是必然?我们决定从AI商拍产品切入,一探究竟。
静态产品图生成功能已趋于成熟
笔者测试了6款提供AI商拍工具的产品,其中2款效果欠佳,不予赘述。多数产品提供三类功能:静态产品图生成、真人模特换脸、基于产品/假模生成模特图。静态产品图生成功能门槛最低,各产品在细分功能上已相当成熟。假模生成模特图功能部分产品暂未开放,部分需联系销售或加入候补名单。静态产品图生成的基本使用流程为:”上传图片——抠产品——选择背景模板生成新背景/输入prompt生成新背景”。笔者在4款产品中上传了相同的”手托酒瓶”图片。
zmo.ai:自动抠图保留手部,但参考图变形功能实用
zmo.ai仅支持自动抠图(自动识别产品边框后抠图),因此笔者不得不保留手部,这对电商卖家来说是个明显缺陷。在生成新背景环节,zmo.ai提供三个功能:选择背景模板、输入prompt生成背景、上传参考背景图后根据参考图生成类似背景。对比来看,zmo.ai的模板数量不算多,但参考图变形功能十分便捷。生成图片后,zmo.ai允许用户调节参数,使成图更自然有质感。
WeShop:色块分割精细但保留原图手部,高级自定义功能实用
WeShop会将原图分割为多个色块,用户可勾选保留区域或上传蒙版图。虽然色块分割精细,但笔者仅勾选酒瓶后,生成图片中仍残留原图手部影子。经了解,WeShop为使商品与背景融合更好,AI生成时会以原背景为基础,在测试WeShop真人图和人台图时也发现相同情况,建议其上线抠图后清除背景功能,更方便使用。生成新背景步骤提供三个功能:背景模板、输入prompt生成背景、高级自定义。前两个功能与zmo.ai类似,高级自定义允许用户输入正反向咒语(希望出现和不希望出现的元素),帮助WeShop更快生成符合预期的图片。
xiangji.ai:智能抠图精准,支持线稿元素控制背景
笔者认为xiangji.ai的抠图功能做得最好,除智能抠图外还支持精细抠图(通过描点选定保留或去除部分),在4款工具中唯一生成图片完全不含原图手部影子。两点值得关注:首先,电商拍摄产品图时通常避免”手”等干扰元素,因此手动抠图是否必要值得商榷;其次,许多修图App的抠图功能已达到甚至超越xiangji.ai的水平。背景生成环节,用户可通过选择模板并添加线稿图(希望出现的元素)来控制背景,也可调节参数优化成图效果。强行修改prompt后生成的图片未出现”爆米花”等无关元素,说明xiangji.ai的场景融绘框仅展示用户选择内容,不支持输入prompt生成背景。
nolibox.com:融合多款产品功能,细节需求待洞察
nolibox.com的静态产品图生成功能整合了上述产品的特点,支持选择背景模板、输入prompt生成背景,可像zmo.ai一样进行参考图变形、调整参数,也可像xiangji.ai一样添加线稿元素。不难看出,在静态产品图生成功能上,各服务商已开始在细节上竞争,关键在于谁能更精准把握电商从业者的需求。技术门槛方面,生成静态产品图并不复杂。
从idea到产品落地仅需1个月
为了解AI To电商的应用现状,笔者联系了WeShop负责人吴海波。吴海波表示:”搭建底层模型需要大量人力资金,所以OpenAI、Midjourney等头部企业主导。多数厂商无力自建模型,包括我们。WeShop团队不到20人,因此采用拥抱开源策略。”WeShop采用开源的Stable Diffusion(SD)作为底层模型。从底层模型到WeShop 1.0版本只需两步:
吴海波介绍:”2022年10月SD 1.5推出后,GitHub社区基于此优化出大量场景模型。SD 1.5生态极为丰富,几乎能满足所有特定功能需求,如优化人像、提升动漫效果等。WeShop明确目标后,在社区中找到最优模型(check point)并测试调参,实现快速’缝合’。这是第一步,耗时极短。”
第二阶段对模型进行微调。吴海波解释:”SD 1.5基于20亿张图片训练,我们用其部分数据量级进行微调。数据投喂越多越好,但挑选、打标、审核耗时且需保证质量。WeShop使用蘑菇街积累的电商图片数据,包括运营社区卖家图片、签约KOL图片、国内外全品类产品图等。这些准备使WeShop落地时间控制在1个多月,比从0到1的厂商更快。”
技术壁垒并不高,但早期布局和持续迭代是关键。吴海波从产品角度强调:”AIGC应用创业中,技术并非核心,关键是对产业需求的深刻理解。互联网行业不乏例子,如字节跳动将算法推荐与内容产业完美结合。WeShop作为商拍场景工具,源于蘑菇街12年电商积累,我们不仅了解商家需要什么商拍图,还能指导中小商家如何使用WeShop提升图片质量。这种产业理解倒推我们在细节上满足客户需求。AI创业真正的壁垒在于发现并满足用户潜在需求,将每个细节做到极致。”
初步测试和研发周期显示,各厂商确实在加速布局,平台功能尚待完善。模特换脸和假模生图功能尤其不成熟。
模特图生成功能:缺乏绝对强者
仅测试了zmo.ai和WeShop的模特换脸功能。上传冷脸女孩展示黑色T恤图片后,zmo.ai允许用户通过prompt自由发挥,出图效果良好。WeShop则提供人种和场景模板选择,更易上手。WeShop新推出的”复刻任务”功能允许将已完成任务用于新任务,方便制作同模特不同姿势的组图。吴海波解释:”人脸固定存在隐私和版权风险,我们近期通过技术方案解决,即仅限使用WeShop生成的人脸固定模特,无法使用外部肖像。”静态产品图到模特换脸再到基于产品生成模特图,难度逐层递增。zmo.ai和nolibox.com的AI时尚模特功能暂未体验,仅测试了WeShop。用户需上传产品人台图(真人比例假人模特穿上产品的图片),生成效果不稳定,有时服装与产品不符或AI模特身体部位不真实,需多次尝试。
AI商拍图工具涌现,首先受益中小出海卖家
市场利好的一面是,各方对AI热情高涨,乐于尝试,包括大型国内外品牌。吴海波透露:”一些企业缺乏既懂业务又了解AI的高管,导致虽想结合AI却不知如何下手,因此会先了解市面上的产品获得思路。”大企业真正融合AI产品并非易事,目前主要用户反而是中小卖家和国内经销链路起点的档口卖家。吴海波解释:”小卖家机动性强,SKU不多,基础套餐(每月298元)足够,成本可控。国内电商链路成熟,相关服务成本更低,卖家更看重生图效果而非价格。我们常一天迭代多个版本以满足需求。”
各产品会员价格(从上至下:zmo.ai、weshop.ai海外、weshop.com国内、xiangji.ai)
大量同类产品竞争下,厂商仍需持续探索。从产品定位看:zmo.ai希望改变内容创作方式,未来可能不局限于电商;xiangji.ai已有象寄翻译、AI文案等矩阵产品,计划为电商提供更多工具;nolibox.com推出AI绘画、AI商品图及智能设计产品,目标用户与zmo.ai重合度较高;WeShop则着眼于探索AI与人类员工的新型工作流协同模式。
目前这一细分领域尚未出现寡头,更优底层模型、产品功能定价优化及企业战略调整都可能改变竞争格局。入局者仍大有可为。欢迎读者推荐其他AI商拍图产品或细分领域应用案例,我们将一一测试。本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有疑问,请联系http://www.idea2003.com/。