

声明:本文源自微信公众号数字生命卡兹克,作者卡兹克授权站长之家转载发布。周末偶然发现一款令人惊叹的3D创作工具NanoBanana也进军了这一领域。其中一项核心功能尤为引人注目——通过语音提示实现局部编辑。对于熟悉NanoBanana的用户来说,这绝非新鲜事。但正是这项功能,让我补全了一块有趣的拼图,让我更加坚信,用语言操控世界终将成为现实。在图像领域有NanoBanana,视频领域有可灵o1,如今3D领域,hyper3D携Rodin Gen-2强势登场。这或许是首个也是唯一一款支持语音编辑3D模型的AI产品。更令人惊喜的是,你只需上传任意第三方模型,即可进行自由修改。这简直太酷了!回想2019年,我还在学习C4D和Blender,看着kuku的手拉box渲染模型,压根没想过有朝一日能通过语音来编辑模型。原来只需动动嘴,就能改变模型的形态…更多详情请访问:https://hyper3d.ai/

进入hyper3D平台后,你会看到两个主要功能卡片:图生3D模型和直接上传任意OBJ、FBX等3D模型进行编辑。而最让我着迷的,正是后者。这意味着你可以对任何第三方模型进行二次创作。比如从Sketchfab下载一个热门模型,导入Blender后,它看起来是这样的。过去,想要修改这类复杂模型简直难于登天,无论是用于3D打印、独立游戏开发还是动画制作,都极其繁琐。现在,只需将模型放入hyper3D的Rodin中,用语音指令就能轻松实现。一句话,就能达到这样的效果,简直不可思议。这就是语音编辑3D模型的魅力所在。

考虑到许多用户可能对3D技术不太熟悉,我将用图生3D模型的完整流程为大家演示。先来看个例子。比如我这里有个高达图片,是之前用NanoBanana生成的,效果相当不错。直接上传后,几十秒内就能生成模型。虽然这个模型还存在一些问题,比如翅膀只有一半,与主体连接也不自然,但这些问题都能轻松解决。将手悬停在重做按钮上,会弹出修改选项。虽然这个交互设计略显隐蔽,但功能非常强大。将模型区域框选后,当部分变成水波纹状时,就表示已选中。在下方选项中,可以选择添加、移除或修改。我决定进行一次有趣的改造,将机甲头部替换成蜡笔小新的头部。很快,模型就焕然一新。不过眼睛部分还没显示,那是因为尚未应用材质,并非bug。接着,由于我想3D打印这个模型,而翅膀结构复杂,直接使用移除功能将其删除。几秒钟后,翅膀就消失了。

看到这里,你可能会产生疑问:既然可以用NanoBanana修改图像并重新生成3D模型,为什么还要费劲地用语音编辑呢?从表面上看,你的观点有一定道理。但3D技术往往与”3D资产”紧密相连。当你将3D视为资产而非普通模型时,其价值将大幅提升。3D与图像的本质区别不在于维度差异,而在于后者附带大量制作过程中不可或缺的元素:拓扑结构、UV映射、材质分层、法线细节、骨骼绑定、碰撞体、关键帧动画等等。当模型已经完成所有这些复杂工作后,重新生成模型将面临巨大挑战。想象一下,如果每次修改都需要重新制作,相关团队恐怕会崩溃。这正是NanoBanana修改图像时强调一致性的原因——避免局部修改引发全局变动。3D领域同样如此,任何模态转换都可能导致信息损失。语音编辑3D真正成功的条件是,它能够实现局部、可控、可回滚的增量修改,而非简单重新生成模型。

让我们来看两个典型场景。首先是游戏和影视制作中,角色模型需要反复迭代数十次。导演可能要求”鼻梁再高一点”、”铠甲变薄一些”、”肩甲外扩两厘米”,建模师只需修改局部网格和材质层,同时保持骨骼蒙皮和动画可用。如果每次都重新生成模型,之前的绑定、动画和物理效果将全部丢失,这完全不符合资产管理的逻辑。其次是电商模型,比如更换杯子logo、鞋子鞋带颜色或包装盒开窗。直接重新生成模型往往会导致厚度、圆角、比例、材质粗糙度等细节发生改变。而我们需要的是精确修改特定部分,其他像素级细节保持不变。这种需求在3D领域更为迫切,因为保持一致性比图像更困难。过去,这类修改基本只能通过手动操作完成,AI很难提供有效帮助。这就是为什么我在开头强调,hyper3D的语音编辑功能如此强大,尤其是支持任意模型上传和修改,更是突破性的创新。

回到之前的案例。蜡笔小新机甲生成后,选择三角面网格并确认材质,模型就出现在眼前。虽然初始效果略显简单,但考虑到最终要3D打印,这样的外观很合适。为了展示效果,我又添加了翅膀。最终成品超级酷炫。模型下载后,我们公司最近正好配置了一台拓竹H2C 3D打印机,就用来打印了这个蜡笔小新机甲。打印完成后,放在桌上当装饰效果还真不错。说实话,AI3D技术与3D打印的结合确实很有趣。此外,hyper3D还支持remix功能,类似NanoBanana的融合创作。比如将戴珍珠耳环的少女与墨镜融合,或将金毛犬与怪奇物语元素结合,打印出来的作品都令人惊叹。如果不是3D打印过程耗时较长(每个模型需要七八个小时),我简直想打印一整车…这个时代真的太棒了。未来,绝大多数事物或许都将通过我们的语言和文字来驱动。虽然有人认为”文字已死,视频当立”,但现在看来,文字的力量被无限放大。用语言操控一切,这就是超酷的未来。











