Meta 公司于 6 月 19 日正式发布了其最新研发的生成式人工智能技术——Voicebox,这一创新突破为音频合成领域带来了全新可能。与 ChatGPT 和 Google Bard 等依赖自然语言处理和机器学习生成文本的模型不同,Voicebox 的核心功能在于生成任意音频内容。

Voicebox 的独特之处在于其强大的音频样本处理能力。只需用户提供 2 秒钟的音频样本,该技术即可精准匹配音频风格,实现高质量的文本转语音功能。更令人惊叹的是,Voicebox 能够在音频被外部噪音干扰时,智能重建被中断的语音片段,确保音频的完整性和流畅性。此外,该技术还支持多语言朗读,用户只需输入英文文本,即可将其转化为法语、德语、西班牙语、波兰语或葡萄牙语等多种语言,极大地拓展了音频应用场景。

Meta 公司表示,Voicebox 在虚拟助手和元宇宙非玩家角色的语音生成方面具有巨大潜力。在元宇宙这一数字世界中,人们可以聚集工作、娱乐和交流,而 Voicebox 生成的自然真实语音将极大提升用户体验。同时,该技术也为视力受损人士带来了福音,让他们能够通过听到朋友们的声音来朗读信息,有效改善沟通体验。

目前,Voicebox 仍处于研发阶段,尚未向公众开放使用。Meta 公司强调,他们充分认识到这项人工智能技术可能带来的潜在风险,特别是语音伪造等安全问题。为此,团队正在积极探索有效方法,以区分真实语音和由 Voicebox 生成的音频,确保技术的安全性和可靠性。随着技术的不断成熟,我们有理由相信 Voicebox 将为音频领域带来更多创新应用,开启音频交互的新纪元。

最新快讯

2025年12月16日

14:20
2025年12月15日,商汤科技在备受瞩目的产品发布周上正式推出了全新升级的Seko2.0版本,为AI视频创作领域带来了革命性突破。此次升级不仅全面优化了用户界面,更在智能体调度功能上实现了重大突破,现在支持在百集以内完成连续剧本的创作,极大提升了内容生产的连贯性与效率。 Seko2.0版本的核心亮点在于集成了先进的SekoIDX与SekoTalk技术。...
14:20
2025年12月16日,备受瞩目的韦氏词典正式揭晓年度词汇——"slop",这一词汇精准捕捉了人工智能批量制造的低质数字内容现象。词典机构之所以选择该词,源于其近年来在搜索引擎中的指数级增长和广泛传播,深刻反映了AI技术滥用导致网络空间充斥着大量虚假、粗糙且毫无价值的信息内容。韦氏词典总裁格雷格・巴洛在官方声明中强调:"slop这个词完美诠释了当下令人忧虑的...
14:20
12月16日,阿里巴巴重磅推出新一代视频生成模型——万相2.6,为专业影视制作与图像创作领域带来革命性突破。该模型在原有基础上全面升级,新增支持角色扮演、音画同步、多镜头生成及声音驱动等核心功能,凭借其强大的综合能力,已跻身全球功能最全的视频生成模型行列。值得一提的是,万相2.6作为中国首款具备角色扮演功能的视频模型,将极大提升内容创作的灵活性与表现力。目前...
14:20
2025年12月16日,重庆市正式发布《加氢站行业发展规划(2025—2035年)》,标志着成渝氢走廊建设进入全新发展阶段。该规划以构建绿色高效物流体系为核心,重点推进以渝蓉、成渝、成遂渝高速为主干的交通走廊建设,将重庆两江新区汽车产业园、果园港、成都国际航空枢纽等关键物流节点紧密串联。据统计,这条走廊年货运量突破2.2亿吨,物流车保有量超过5万辆,为氢能应...
14:20
2025年12月16日,全球能源巨头壳牌公司传来重要人事变动消息,其并购团队负责人Greg Gut正式宣布离职。这一决定与近期备受瞩目的壳牌收购英国石油公司(BP)的并购计划直接相关。据悉,Gut曾作为核心决策者主导了此次收购要约的提出,然而该方案最终遭到公司首席执行官的明确否决,导致整个并购进程被迫终止。作为壳牌战略部门的中坚力量,Gut的离职无疑反映出公...
14:20
2025年12月16日,成都土地市场迎来一场备受瞩目的土拍活动,共计出让3宗住宅用地,最终总成交金额高达13.39亿元,呈现出鲜明的区域分化特征。其中,位于核心区域的锦江区地块成为焦点,由渝太集团旗下成都瞻辰置业凭借9.04亿元的天价竞得,折合楼面价达到21500元/㎡,溢价率虽仅为5.91%,但依然彰显出核心地段的价值吸引力。而在东部新区和新津区,两宗地块...
14:20
2025年1月至11月期间,江西省规模以上工业增加值展现出强劲的增长势头,同比增长率达到7.6%。这一成绩的取得,主要得益于制造业的显著拉动作用,其增长率高达8.4%,成为推动整体工业增长的核心动力。与之形成对比的是,采矿业在这一时期出现了5.1%的负增长,显示出该行业面临的挑战。而电力、热力等供应业则实现了2.7%的稳健增长,为工业体系的稳定运行提供了有力...
14:20
2025年12月11日,微软正式宣布将彻底淘汰其Windows身份验证系统中已沿用25年的RC4加密算法。这一决定源于该算法长期存在的严重安全漏洞。RC4算法因缺乏必要的加盐机制,且其依赖的MD4哈希函数已被证明存在设计缺陷,使其极易遭受Kerberoasting攻击。这些安全隐患不仅威胁着企业数据安全,更可能造成大规模信息泄露。 微软原计划在今年内完成RC...
14:20
2025年12月16日,科技圈传来重磅消息,知名数码博主独家爆料,三星正在积极研发一项革命性技术——将折叠屏与可变光圈技术相结合,旨在为即将到来的2026年新款iPhone正面挑战。这一举措被业界视为三星在高端手机市场应对苹果创新策略的关键一步。 与此同时,苹果公司也展现出惊人的研发速度。据内部消息,苹果计划在2027年将屏下前摄技术成功应用于直板机型,并同...
14:20
安顾中国携手普华永道重磅发布《低利率环境下寿险公司资产负债管理思路》深度白皮书。这份权威报告全面剖析了欧美及亚洲主要寿险市场在长期低利率背景下的应对策略与实践经验,通过深度结合中国寿险行业的具体现状与企业实地调研数据,系统性地提出了覆盖资产配置与负债管理、财务表现与资本运作、全生命周期规划等多维度的管理建议。该白皮书旨在为中国寿险企业构建科学有效的资产负债管...
14:18
12月16日,阿里巴巴重磅发布新一代万相2.6系列视频生成模型,凭借在专业影视制作和图像创作领域的全面升级,被业界誉为**"全球功能最全的视频生成模型"**。该模型已同步登陆阿里云百炼平台和万相官网,为创作者提供更强大的视觉创作支持。 万相2.6系列模型的最大创新在于国内首创的"角色扮演"功能,同时集成了音画同步、多镜头生成及声音驱动等先进技术。此次升级在画...
14:18
谷歌搜索近日悄然上线了一项令人瞩目的新功能——**“+”按钮**,它赋予用户上传图片与文档的能力,并借助谷歌的 Gemini AI 模型进行深度内容分析。尽管谷歌尚未正式公布相关公告,但这一功能很可能仍处于内部测试阶段,目前仅对部分幸运用户开放。 用户只需通过“+”按钮上传所需图片或文档,即可轻松激活 Google AI 模式。Gemini AI 将迅速...