火山引擎发布豆包图像编辑同传模型 加速Agent开发落地

7月30日,火山引擎在FORCE Link AI创新巡展·厦门站上重磅发布豆包系列新模型及AI云原生服务升级成果,为企业与开发者构建Agent、落地AI应用提供全栈支持。火山引擎总裁谭待现场揭晓了包括豆包·图像编辑模型3.0、同声传译模型2.0,以及全新升级的豆包大模型1.6系列在内的系列创新成果,同时推出扣子核心能力开源、企业自有模型托管方案等实用工具,进一步丰富火山引擎的AI生态体系。

图:火山引擎总裁谭待发布最新豆包模型

豆包系列新模型面向企业开放,直击AI图像编辑中的三大痛点——”听不懂指令、误改内容、生成效果差”。火山引擎推出的豆包·图像编辑模型3.0(SeedEdit3.0)通过强化指令遵循能力、图像保持能力及生成质量,让用户仅凭自然语言即可完成消除冗余、调整光影、替换元素等操作,还能实现风格转换、材质变换、姿势调整等创新修图场景。该模型广泛适用于影像创作、广告营销等领域,企业用户可在火山方舟调用其API,个人用户则能通过即梦或豆包app进行体验。

最新发布的豆包·同声传译模型2.0(Seed-LiveInterpret2.0)突破传统”级联模型”局限,采用全双工框架将语音延迟从8-10秒降至2-3秒,实现文本与语音同步生成。更支持0样本声音复刻,无需提前录制即可实时生成同音色外语语音,甚至匹配方言口音,大幅提升跨语言沟通沉浸感。

火山引擎发布豆包图像编辑同传模型 加速Agent开发落地插图1

豆包大模型1.6系列也进行了全面升级。其中,极速版Doubao-Seed-1.6-flash模型在保持强大视觉理解能力的同时,强化了代码、推理、数学等能力,适配智能巡检、手机助手等大规模商业化场景。该模型TPOT(首Token输出时间)低至10ms,为业界领先;成本上,在0-32k输入文本长度区间(企业最常用),每百万tokens输入仅0.15元、输出1.5元,在客户使用案例中,已实现延迟下降60%、成本降低70%。此外,全模态向量化模型Seed1.6-Embedding首次实现”文本+图像+视频”混合模态融合检索,助力企业构建更强大的多模态知识库,在权威测评中包揽多模态全面任务及中文文本的最优成绩。

为助力Agent端到端开发与落地,火山引擎持续优化AI云原生全栈服务。7月26日,AI Agent开发平台扣子核心能力正式开源,涵盖一站式可视化开发工具”扣子开发平台(Coze Studio)”和全链路管理工具”扣子罗盘(Coze Loop)”,采用Apache2.0许可证,用户可在GitHub下载。开源仅三天,Coze Studio星标数破万,Coze Loop星标数超3000。火山引擎为其提供全面支持,企业AI平台HiAgent可调用其能力,云基础产品支持一键部署。

针对有模型定制需求的企业,火山引擎依托火山方舟模型单元推出自有模型托管方案。企业无需运维底层GPU资源及复杂配置,即可实现自研模型全托管,享受弹性算力,自主选择部署方式与机型,精准控制时延,且无需为业务低谷期付费,目前已开放邀测。同时,火山方舟升级API体系,推出Responses API。该API具备原生上下文管理能力,支持多轮对话链式管理及文本、图像等多模态数据衔接,结合缓存能力可降低80%成本;还支持单次请求联动多工具与模型组合响应,将智能助手Agent开发从460行代码、1-2天,缩减至60行代码、1小时,大幅提升效率。

此次系列发布进一步完善了火山引擎AI生态布局,为企业与开发者提供从基础模型到开发工具的全链条支持,加速AI在各行业的落地应用。

最新快讯

2026年03月04日

09:31
3月3日晚,在2026年总台元宵联欢晚会上,主持人撒贝宁遭遇了一场超逗的“意外”,把观众们笑得前仰后合。当时,撒贝宁正在舞台上全情投入地主持节目,突然,节目组“搞事情”,亮出了他春晚同款“老鼠干”表情包的实体道具。这突如其来的一幕,让撒贝宁瞬间愣住,紧接着他双手抱头,表情失控,整个人就像被定住了一样,那反应呆萌又搞笑,喜剧效果直...
09:31
微新创想3月4日消息,小米官方今日发布公告,新一代小米SU7实车已陆续抵达全国143个城市的492家门店。这款备受瞩目的新车预计将于4月正式上市,目前的预售价格为22.99万元起。新一代小米SU7在安全配置上进行了系统性的全面强化。全系标配了2200MPa超强钢材质的内嵌式防滚架,结构完整覆盖从A柱到C柱的关键区域。此外,车辆还...
09:31
针对日益严重的AI使用安全性及心理健康争议,OpenAI于当地时间 3 月 3 日宣布,将在ChatGPT中引入一项名为“可信联系人”的新功能。该功能允许成年用户指定一位紧急联系人,当系统检测到用户在使用聊天机器人过程中出现心理健康危机时,将自动向其发送警报通知。这一功能的推出背景颇为沉重。据不完全统计,OpenAI目前正面临至少 13 起独立的消费者安全诉...
09:31
中国大模型正在全球开发者社区掀起一场名为“性价比”与“工程化”的狂暴飓风。2026 年 3 月 3 日,根据全球最大的 API 聚合平台 OpenRouter 的最新数据,国产大模型展现了前所未有的统治力:MiniMax M2.5 的调用量位居全球第一,而排在其后的分别是 Kimi K2.5 和 GLM-5。这一“国产三强”霸榜前三的局面,标志着在 AI 应...
09:31
2026年3月4日,全国人大代表、小米集团董事长兼CEO雷军正式提交五份建议,重点聚焦通用人形机器人、智能驾驶安全、科技公益及人才培养等前沿领域,旨在通过政策与技术标准协同,加速我国AI与智能制造产业的深度融合。雷军在建议中指出,人形机器人作为继智能手机、新能源汽车后的颠覆性产品,正处于从实验室走向产业化的关键期。尽管我国在技术领域具备先发优势,但工艺稳定性...
09:31
继 ChatGPT 和 Claude 网页版相继推出语音交互后,AI 编程领域也迎来了“动嘴”革命。当地时间3月3日,AI 巨头 Anthropic 宣布为其面向开发者的命令行工具 Claude Code 正式引入语音模式。这意味着开发者现在可以跳过键盘,直接通过语音指令让 AI 执行复杂的编程任务。据 Anthropic 工程师 Thariq Shihip...
09:31
Google DeepMind 近日正式发布 Gemini3.1Flash-Lite 预览版,标志着 Gemini3系列中速度最快、性价比最高的成员面世。作为 Gemini2.5Flash-Lite 的迭代产品,新模型在保持每秒超360个 token 的极速输出及5.1秒平均响应时间的基础上,实现了智能水平的显著跨越。根据 Artificial Analys...
09:31
当人工智能掌握了核武器的“发射按钮”,世界会变得更安全吗?伦敦国王学院教授肯尼斯·佩恩的一项最新研究给出了令人不寒而栗的答案。实验显示,在模拟核危机场景中,大语言模型(LLM)更倾向于升级冲突,甚至在 95% 的推演情境中都选择了部署或使用核武器。图源备注:图片由AI生成,图片授权服务商Midjourney这项研究调用了当前全球最尖端的三个 AI 模型:GP...
09:31
微新创想:谷歌智能家居(Google Home)正迎来一场彻底改变“看家”逻辑的重大升级。2026年3月2日,谷歌家居负责人阿尼什·卡图卡兰在社交平台宣布,多项基于Gemini大模型的深度优化正式向用户推送。其中最令业界震撼的,是名为“Live Search(实时搜索)”的功能。这意味着你的Nest摄像头从此拥有了“大脑”,能够实时理解正在发生的画面,而非仅...
09:31
微新创想:3月3日,阿里巴巴创始人马云与蔡崇信、吴泳铭等核心管理层现身杭州云谷学校,就AI时代的机遇与挑战同师生展开深入交流,释放出阿里巴巴集团及蚂蚁集团全面加码AI战略的明确信号。马云在交流中指出,AI时代的加速到来将对社会产生深远冲击,而青少年群体作为未来的希望,更需具备应对技术变革的能力。 此次阿里与蚂蚁两集团管理层罕见聚齐,旨在分享阿里巴巴近期在AI...
08:39
微新创想:3月4日前,中科院光电所联合多家单位在云南丽江高美古观测站开展星地激光通信试验。此次试验依托自主研制的1.8米地面站,团队成功与地球同步轨道卫星建立稳定激光链路。在40740.96公里的最远距离下,实现了上下行对称1Gbps的双向高速通信。 微新创想:试验过程中,建链仅需4秒,链路连续稳定运行超过3小时。这一突破性表现不仅验证了激光通信在超远距离下...
08:39
微新创想:2026年3月3日,特斯拉柏林超级工厂生产负责人安德烈·蒂里希在领英上发布声明,否认德国《商报》关于该工厂2025年仅生产14.9万辆Model Y以及仅0.74%利润率的报道。蒂里希明确表示,2025年的实际产量已超过20万辆,并且各季度之间呈现出持续增长的趋势。此外,他提到自2022年工厂正式投产以来,累计生产量已突破70万辆。 蒂里希还强调,...