【AIbase 报道】语音生成领域的创新先锋 Fish Audio 宣布正式推出升级版 S1 语音克隆模型,在情感表现力与拟真度方面取得革命性突破。新版模型能够生成兼具丰富情绪、精准节奏与自然语气的真人级声音,几乎完美捕捉人类说话时的所有细微特征。
据悉,用户仅需提供约 10 秒的语音样本,S1 即可精准克隆任意人声,并完整保留原声的口音、语调与节奏,还...
分类: AI动态
2025年10月21日
多模态大模型(MLLM)在应对复杂问题时的表现日益亮眼,但其推理过程往往缺乏灵活性,难以像人类一样进行深度反思和调整策略。面对需要反复尝试的挑战时,这些模型常常陷入“耿直”的困境,无法有效回溯和优化思路。为突破这一瓶颈,上海交通大学与上海人工智能实验室的研究团队联合发起了一项名为 MM-HELIX 的前沿项目,致力于让 AI 掌握长链反思性推理的能力,使其决...
人工智能领域的领军企业 Anthropic 正式发布了一款专为生命科学研究者打造的 AI 工具——"Claude for Life Sciences"。这款创新工具通过深度整合实验室工作流程,致力于帮助科研人员加速药物发现和生物医学创新进程。这标志着 Anthropic 首次正式进军生命科学领域,实现了从通用 AI 模型向行业垂直应用的重大战略转型。
背景与...
最新消息显示,百度旗下创新产品小度AI眼镜即将在11月举办的百度世界2025大会上揭开神秘面纱,并有望于今年年内正式开售。这款集多模态AI技术与可穿戴设备于一体的智能硬件,不仅代表了百度在前沿科技领域的重大突破,更标志着其在构建智能硬件生态体系上迈出了关键一步。
回顾2024年百度世界大会,小度AI眼镜就已率先亮相,当时展示了令人印象深刻的六大核心功能:通过...
Adobe 近期正式宣布推出创新服务——Adobe AI Foundry,为企业客户提供高度定制化的 AI 模型 Firefly。这一全新服务旨在通过深度合作,重新架构并再训练 Firefly 模型,以满足企业客户的独特需求。与普通定制 Firefly 模型不同,Foundry 版本的模型具备理解多概念的能力,而常规模型则专注于单一概念。此外,Foundry...
上海人工智能实验室联合浙江大学等顶尖机构近日重磅发布IWR-Bench,这是全球首个专门针对大语言模型视频转网页代码能力的基准测试平台。该基准填补了AI前端开发领域动态交互评测的关键空白,旨在更真实地衡量多模态大语言模型(LVLM)在动态网页重建方面的综合能力。
与传统的图像转代码(Image-to-Code)任务截然不同,IWR-Bench要求模型通过观看...
OpenEvidence 医疗人工智能平台近日宣布成功完成新一轮2亿美元融资,公司估值飙升至惊人的60亿美元。这一令人瞩目的成就紧随三个月前该公司完成2.1亿美元融资、估值达到35亿美元之后,再次印证了资本市场对医疗领域专属AI应用的强烈信心。图源备注:图片由AI生成,图片授权服务商Midjourney
OpenEvidence 于2022年创立,致力于为全...
字节跳动旗下AI助手应用Cici近期在海外市场展现出惊人的增长势头,成为全球AI领域备受瞩目的新势力。该应用在墨西哥谷歌应用商店荣登下载榜榜首并持续领跑一周,同时在英国苹果应用商店也成功跻身免费应用前十强。这一系列突破性成绩的背后,是字节跳动精心布局的双品牌海外扩张战略。与国内同期的豆包AI助手形成互补,Cici以独立品牌形象进军国际市场,展现出字节跳动在A...
Anthropic公司于本周正式发布了AI编码助手Claude Code的网页应用版本,这一创新举措允许开发者直接在浏览器环境中创建和管理多个AI编码代理。这一发布不仅标志着Claude Code从传统的命令行工具成功转型为跨平台产品,更体现了Anthropic在AI编码领域的持续探索与突破。目前,Claude Code网页版已向Anthropic的付费订阅...
IBM 与 Groq 公司正式宣布达成战略合作关系,双方将携手加速智能 AI 技术在企业场景中的落地应用。此次合作的核心是将 IBM 的 Watsonx Orchestrate 平台与 Groq 的创新推理技术 GroqCloud 进行深度整合,通过这种技术协同实现成本效率与工作速度的双重突破。根据双方联合发布的新闻稿,这种技术组合能够使客户在处理 AI 工...
谷歌 DeepMind 今日震撼发布其尖端 AI 视频生成模型 Veo 的重大突破——革命性的“精确编辑”功能。这一创新技术赋予用户前所未有的能力,只需通过简单的文本指令,即可在现有视频内容中精准添加或移除道具、角色乃至背景物体,同时借助智能算法无缝重建场景,确保物理真实性与视觉连贯性,完美无损地保留原始视频的完整风貌。据权威 AI 媒体 AIbase 深度...
Periodic Labs 是一家由前 OpenAI 研究员 Liam Fedus 与前 Google Brain 同事 Ekin Dogus Cubuk 联合创办的尖端科技初创公司。该公司在上个月成功斩获3亿美元巨额融资,由 Felicis 领投,并吸引了众多顶级天使投资人及风险投资机构的鼎力支持。图源备注:图片由AI生成,授权服务商Midjourney
...
Salesforce 公司近日陷入了一场备受瞩目的法律风波,其 xGen 系列大语言模型被指控在训练过程中涉嫌大规模使用盗版书籍数据。两位美国小说家莫莉・坦泽(Molly Tanzer)和詹妮弗・吉尔摩(Jennifer Gilmore)于10月15日在旧金山的美国地方法院提起了集体诉讼,直指 Salesforce 未经授权下载、存储、复制并利用了大量受版权...
Adobe创意软件巨头于本周正式推出全新AI Foundry服务,为企业客户提供定制化生成式AI模型的构建平台。这一创新服务标志着Adobe从通用AI工具供应商向企业级定制AI解决方案服务商的战略转型,为品牌客户带来前所未有的智能化创作体验。
AI Foundry服务基于Adobe自研的Firefly系列AI模型打造,该系列模型于2023年首次亮相,已成功应...
DeepSeek-OCR:开启文档智能解析新纪元
近日,领先的AI技术公司DeepSeek重磅推出了一款创新的光学字符识别(OCR)模型——DeepSeek-OCR。这款端到端的视觉语言模型(VLM)以突破性的技术,将长篇文档高效压缩为一组精简的视觉标记,再通过强大的语言模型进行解码,实现了前所未有的文档解析效率。研究团队在权威的Fox基准测试中取得了令人瞩...
腾讯AI实验室近期推出了一项突破性的模型优化技术——"无训练组相对策略优化"(Training-Free GRPO),为AI领域带来了革命性的变革。这项创新技术通过引入外部知识库更新机制,巧妙地替代了传统的参数微调方式,在显著降低训练成本的同时,实现了与高成本微调方案相当的性能表现。其核心突破在于将人类经验知识转化为token级别的先验信息,使得大模型能够在...
【AIbase 报道】IBM 近期宣布与芯片初创公司 Groq 正式达成战略合作,将 Groq 的高性能推理技术深度集成至 watsonx 平台,为企业客户提供更快速、更具成本效益的人工智能解决方案。这一合作标志着 IBM 在企业级 AI 加速领域取得了重大突破,为企业客户开启全新的智能化体验。
通过此次合作,IBM 用户将能够在 Watsonx Orche...
DeepSeek近日重磅推出其革命性OCR文档理解模型——DeepSeek-OCR,在图像文档解析领域取得突破性进展。该模型的核心亮点在于创新性地引入了"视觉记忆压缩"机制,这一大胆构想旨在彻底解决大型语言模型(LLM)在处理超长上下文时面临的计算资源急剧消耗的难题。
DeepSeek-OCR的核心突破在于模拟人类视觉记忆机制,将长文本信息压缩至图像空间,从...
Adobe即将推出一款名为"AI Foundry"的创新企业服务平台,为寻求自主开发定制化生成式AI模型的企业提供全方位解决方案。该平台基于Adobe自主研发的Firefly模型,该模型完全采用授权数据训练而成,能够帮助企业利用自身品牌资产和知识产权,为文本、图像、视频及3D内容打造专属AI模型。
法律保障成为核心竞争力Adobe高级副总裁Hannah El...
OpenAI于10月20日重磅发布一项突破性更新,旨在全面保护艺术家的声音与肖像权益。这项创新举措是在与美国演员工会(SAG-AFTRA)深度合作、携手知名演员布莱恩·克兰斯顿以及多家顶尖艺能机构的共同推动下完成的,其核心目标是为OpenAI最新研发的Sora2技术建立更为严格的监管框架。Sora2作为一款能够精准模拟人类声音与形象的前沿AI产品,随着应用场...
新浪科技最新消息,阿里巴巴旗下AI旗舰应用夸克正在加速布局下一代智能产品,其代号为“C计划”的核心项目已进入关键推进阶段。这项由夸克核心团队牵头、通义实验室多位资深专家参与研发的重磅AI计划,将聚焦于对话式AI应用的创新布局,并有望在近期推出首个阶段性成果。
据多位行业知情人士透露,“C计划”是一项需要长期战略投入的AI产品,其成功高度依赖于底层模型技术的突...
埃隆·马斯克近日在社交平台X上发布惊人言论,透露他对xAI公司即将推出的新一代大型语言模型Grok5的信心已达到前所未有的高度。这位科技巨头表示,Grok5实现通用人工智能(AGI)的可能性已从之前的预估提升至10%,并且这一概率仍在持续攀升。这一表态迅速引发了全球科技界的广泛关注,因为截至目前,全球范围内尚无任何企业真正成功实现AGI,而众多顶尖科技公司正...
人工智能公司 Anthropic 正式宣布推出 Claude Code 网页版,为全球开发者带来革命性的编码体验。这一创新工具彻底改变了传统编码模式,让开发者能够直接在浏览器中运行 Claude 进行各类编码任务,无需再受限于繁琐的命令行操作和复杂的本地环境配置。无论身处办公室还是家中,开发者都能享受无缝衔接的编码工作流程,大幅提升工作效率。
Claude ...
2025年10月20日
欧洲零售业正经历一场前所未有的变革!英国零售巨头 Frasers Group 成功率先在其全系统中整合了 Commercetools 的智能代理交易系统,这一创新举措标志着大型零售商与人工智能技术深度融合的新纪元。作为首个采用该系统的企业,Frasers Group 让旗下知名品牌 Sports Direct 的顾客得以通过 ChatGPT 等先进AI系统完...
在备受瞩目的 Dreamforce2025 大会上,谷歌及其母公司 Alphabet 的 CEO 桑达尔・皮查伊带来了令人振奋的官宣:备受期待的 Gemini3.0 人工智能模型正加速研发,预计今年下半年正式与公众见面。这款新一代 AI 将在自主决策与执行能力上实现重大突破,相较于前代产品展现出更为革命性的性能表现。作为一款智能代理系统,Gemini3.0 ...
锐步(Reebok)上周五正式宣告进军竞争激烈的健康科技市场,震撼推出旗下首款可穿戴设备——锐步智能戒指。这款创新产品定价249美元(约合人民币1767元),能够全面监测用户的运动表现、心率变化、睡眠质量、压力水平以及体温等关键生理指标。通过精准收集这些数据,戒指能生成独特的"整体评分"(One Score),为用户提供即时且全面的健康状况与训练状态反馈。
...
Bubble 是一款专注于可视化网页及移动应用开发的专业平台,近日正式宣布推出其革命性新产品——Bubble AI Agent,现已在全球范围内开启公测。这款创新工具巧妙融合了人工智能的快速生成能力与用户对开发过程精细控制的需求,让开发者能够通过直观的拖拽操作或自然语言指令来构建和编辑应用,既实现了前所未有的开发效率,又确保了对最终产品的高度掌控。图源备注:...
近日,美国怀恩多特县发生了一件令人惊叹的幸运事件。45岁的塔米・卡维在一次普通的彩票购买中,凭借ChatGPT推荐的号码,成功赢得了10万美元(约合人民币72万元)的Powerball彩票奖金。这一意外之财不仅让她的生活发生了改变,也引发了人们对彩票与科技结合的广泛关注。
卡维的中奖经历充满了戏剧性。她透露,自己平时对彩票的态度相当谨慎,只有在头奖累积超过1...
