分类： AI动态

2025年08月13日

10:03

腾讯混元发布52B参数Large-Vision多模态模型支持任意分辨率全场景输入

腾讯混元团队近日重磅推出全新多模态理解模型——混元Large-Vision，这款模型凭借腾讯混元团队独创的MoE（专家混合）架构，实现了52B规模的激活参数，在性能与效率之间取得了令人瞩目的平衡。混元Large-Vision的核心突破在于其卓越的多模态输入支持能力，不仅能够处理任意分辨率的图像，还能无缝应对视频和3D空间输入，为用户带来全方位的视觉理解新体验...

10:03

昆仑万维开源Skywork UniPic2.0模型突破多模态AI技术

昆仑万维集团在备受瞩目的SkyWork AI技术发布周第三天，正式向全球开发者与研究者开源其最新研发的「Skywork UniPic2.0」统一多模态模型。这一具有里程碑意义的发布，不仅标志着多模态人工智能领域迈入新纪元，更代表着该技术生态的又一次重大突破。Skywork UniPic2.0作为一个面向统一多模态建模的高效训练与推理框架，通过创新性地整合生成...

10:03

Anthropic Claude Sonnet 4模型支持100万词元重大升级

人工智能创新企业 Anthropic 今日正式宣布，备受瞩目的 Claude Sonnet4 语言模型（LLM）已成功升级，支持高达100万个上下文词元。这一突破性进展使 Anthropic 成为继 Google Gemini 之后，全球范围内第二家提供如此庞大上下文窗口的主流模型供应商。此前，Claude Sonnet4 API 的上下文限制仅为20万个词...

08:59

ChatGPT集成Gmail日历联系人提升个性化对话体验

OpenAI 近期重磅宣布，旗下旗舰聊天机器人 ChatGPT（Pro 版本）将正式集成 Gmail、Google 日历和 Google 联系人三大服务。这一创新功能旨在通过深度整合用户的个人信息生态，显著提升 AI 对用户数据的理解与引用能力，从而让每一次人机对话都更加自然流畅、高效精准。未来用户无需再在信息海洋中手动搜寻，只需在聊天界面中轻轻一点，即可直...

08:59

OpenAI推399卢比ChatGPT Go套餐全球用户抢购

OpenAI 近期宣布推出全新订阅套餐——ChatGPT Go，以极具吸引力的月费399印度卢比（约合32.7元人民币）为用户提供深度AI服务。这一超值方案目前聚焦于印度等发展中国家用户，旨在让更多人能够负担得起并享受先进的人工智能技术。作为OpenAI拓展全球用户群体的关键举措，ChatGPT Go套餐的推出将为不同地区用户提供更加公平的AI服务机会。与...

2025年08月12日

18:33

MiniMax开创AI智能体再创作市场 15万美元奖金池助力协作新模式

MiniMax重磅发布全球首创的Agent Remix Marketplace平台，以革命性的商业模式重新定义AI智能体创作生态。该平台的核心创新在于支持用户对已发布的成熟AI作品进行一键式再创作，并通过创新的收益分享机制，确保原作者每完成一次Remix操作即可获得100Credits的丰厚回报。这一突破性平台的问世，标志着AI智能体创作模式从传统单一原创向...

17:20

AI日报：智谱开源百亿级视觉推理模型GLM-4.5V，达摩院推具身智能技术，360智脑亮出Light-IF系列模型

欢迎来到【AI日报】栏目！这里是您每日探索人工智能世界的权威指南，我们为您精选并呈现AI领域的最新热点内容，始终聚焦开发者群体，助您洞悉前沿技术趋势，深入了解创新AI产品的实际应用。新鲜出炉的AI产品推荐，点击了解详情：https://top.aibase.com/1 智谱GLM-4.5V开源发布：全球100B级最佳视觉推理模型智谱公司正式宣布推出并开源了...

16:22

Vercel V0全面升级成全能AI代理自动生成前后端文案引领Vibe Coding新革命

随着人工智能在编程领域的迅猛崛起，Vibe Coding（氛围编码）工具的竞争格局正经历深刻变革。Vercel旗下AI驱动的编码平台V0近日完成重大升级，从单一的前端生成工具华丽转身成为全能型AI代理，全面覆盖从需求分析到部署调试的全栈开发流程。AIbase独家为您深度解析V0的突破性进展，以及其在Vibe Coding领域的独特竞争优势。 V0全面升级：从...

16:22

宇树科技亮相首届世界人形机器人运动会多队采用其硬件

宇树科技官方微信公众号正式官宣，公司将于8月14日至17日盛装亮相首届世界人形机器人运动会。作为行业领军企业，宇树科技此次将携旗下尖端人形机器人硬件产品参展，更值得关注的是，赛场之上还将涌现多支由不同团队组建的队伍，他们均选用宇树机器人作为硬件平台，但会结合各自研发的独特算法进行创新应用。由于赛事项目设置紧凑且数量庞大，宇树团队将根据资源情况参与部分核...

16:22

高德地图2025首发AI原生Agent 通义大模型赋能智能出行

阿里巴巴集团旗下高德地图与通义实验室正式达成深度战略合作，共同宣布将全球首个 AI 原生地图落地应用。这一创新合作成果已率先在高德地图2025版本中全面上线，为用户带来革命性的出行体验。高德地图2025版本的核心亮点之一是全新推出的智能体“小高老师”。这款智能体能够通过语音、文字等多种交互方式，与用户实现自然流畅的对话交流。为打造极致的交互体验，高德地图与...

16:22

华为UCM技术革新大模型推理性能提升降低HBM依赖

8月12日，华为将在2025金融AI推理应用落地与发展论坛上重磅发布革命性AI推理创新技术UCM（推理记忆数据管理器），这一突破性技术有望从根本上改变中国AI推理对高带宽内存HBM的依赖，并实现国内大模型推理性能的跨越式提升。UCM以KV Cache为核心架构，创新性地融合了多类型缓存加速算法工具，通过科学分级管理推理过程中产生的海量记忆数据，成功扩大上下文...

16:22

苹果Apple Intelligence将升级至GPT-5 Siri写作工具视觉智能全面进化

苹果公司即将在下月推出的iOS26、iPadOS26和macOS Tahoe26系统更新中，将Apple Intelligence的核心模型从GPT-4o升级至最新的GPT-5版本。这一重大升级将全面提升Siri的交互体验，增强系统级写作工具的智能化水平，并显著优化视觉智能的准确性和响应速度。据苹果官方透露，GPT-5的引入将带来多维度性能飞跃，不仅使设备在...

15:21

马斯克起诉苹果垄断AI市场引发争议

近日，特斯拉与SpaceX的掌舵人埃隆·马斯克通过社交平台X正式对外宣布，xAI公司将针对苹果公司采取紧急法律行动。马斯克在公开信中强烈谴责苹果的行为，认为其通过App Store的运营规则，几乎将除OpenAI之外的所有人工智能公司拒之门外，这无疑构成了一种"明确的反垄断违法行为"。据图源授权服务商Midjourney提供的AI生成图像显示，这场商业冲突已...

15:21

GPT-oss无提示生成编程难题重复解题5000次现象解析

GPT-oss 近期的表现引发了科技界的广泛关注，其展现出的能力甚至令人惊叹。这款先进的大型语言模型在没有任何外部提示的情况下，竟然能够独立构思出一个极其复杂的编程难题，并且重复解答次数超过5000次，这一成就充分彰显了其强大的逻辑推理能力。该问题以多米诺骨牌为主题，要求在一个NxM的网格中，通过放置骨牌占据两个相邻格子，同时确保剩余空格能够完全拼成多个2x...

15:21

阿里达摩院开源具身智能三大件推动机器人上下文协议RynnRCP发展

在世界机器人大会上，阿里达摩院重磅宣布开源三项自研核心技术：VLA模型RynnVLA-001-7B、世界理解模型RynnEC以及机器人上下文协议RynnRCP。这一战略举措旨在推动数据、模型与机器人本体的兼容适配，彻底打通具身智能开发的完整流程。随着具身智能领域正经历前所未有的快速发展，开发流程碎片化、数据模型与机器人本体适配困难等关键挑战日益凸显。达摩院创...

15:21

Perplexity AI推订阅制视频生成服务文本秒变视频引领AI创作新潮流

Perplexity AI 正式宣布在其全平台范围内推出革命性的视频生成功能，为用户带来前所未有的文本到视频创作体验。这一创新功能根据用户的订阅等级提供差异化服务：Pro 会员每月可生成5个视频作品，而尊贵的Max会员则可享受高达每月15个视频的生成额度。用户现在只需在Perplexity的智能聊天界面中输入文字提示，即可直接生成短视频内容，这一举措标志着A...

14:19

戴盟机器人获亿元天使++轮融资高分辨率触觉技术引领具身智能新突破

触觉传感领域迎来重大突破性融资消息。戴盟机器人（Daimon Robotics）近日宣布成功斩获亿元级天使++轮融资，由招商局创投强势领投，东方嘉富和架桥资本紧随其后参与投资。此次资本注入将全面加速戴盟在全球领先的视触觉感知与灵巧操作技术的商业化进程，进一步巩固其在具身智能技术产业化领域的标杆地位。据悉，戴盟此前已相继获得昆仲资本独家投资的天使轮、国中资本、...

14:19

昆仑万维Matrix-3D开源：单图生成高质量全景视频

昆仑万维在北京举办的 SkyWork AI 技术发布周上，隆重推出了 Matrix-3D 这一革命性的 3D 世界生成大模型，为 3D 生成技术领域带来了突破性的进展。这一创新成果旨在突破传统 3D 场景生成技术的瓶颈，解决其在视角范围、几何一致性和视觉质量方面长期存在的局限性。传统方法往往需要依赖多视角输入才能构建完整的 3D 世界，而 Matrix-3D...

12:13

汉王科技仿生机器鸟亮相机器人大会引领具身智能新赛道

【AIbase 报道】在备受瞩目的2025年世界机器人大会上，汉王科技以"仿生致知，智成身具"的创新主题震撼亮相，全面呈现其在仿生智能领域的原始创新技术及商业化应用成果。此次展会重点展示了仿生机器鸟和安防巡检机器狗等标志性产品，彰显了汉王科技在该领域的深厚积累与前瞻布局。早在十年前，汉王科技便前瞻性地布局仿生智能领域，围绕"感知智能—认知智能—具身智能"的...

12:13

微软Excel新功能Copilot公式讲解内联解释直达单元格

微软正式推出 Excel 的一项革命性更新——由 Copilot 驱动的“解释此公式”功能，为全球数百万数据处理者带来前所未有的便捷体验。这一创新功能致力于解决复杂公式理解难题，通过智能解析显著提升工作效率，让数据分析工作更高效、更直观。该功能的最大优势在于其极致简化的操作流程。用户无需切换界面或打开额外面板，只需选中任意包含公式的单元格，点击 Cop...

12:13

OpenArt前谷歌员工创立AI故事生成器月活600万引发版权争议

AI生成的"脑残视频"正以惊人的速度席卷互联网，成为年轻用户中炙手可热的娱乐现象。这些视频以天马行空的创意内容吸引眼球，从穿着运动鞋的鲨鱼到头部是卡布奇诺的芭蕾舞者，各种奇异角色层出不穷，引发广泛关注和讨论。这一潮流背后的推动者，是2022年由两名前谷歌员工创立的初创公司OpenArt。目前，OpenArt已拥有约600万月活跃用户，成为AI视频生成领域的佼...

12:13

Youware AI一键生成全栈项目数据库边缘函数轻松搞定

近日，AI编码平台Youware迎来颠覆性升级，不仅巩固其在前端生成领域的领先地位，更以创新之举全面进军后端开发领域，为全球开发者呈现一套从概念构思到最终部署的全栈解决方案。这一里程碑式的更新，标志着Youware正式转型为支持前后端一体化开发的综合性AI编程平台，为开发者社区注入全新活力。 Youware新功能：AI赋能全栈开发体验Youware作为全球领...

11:10

OpenAI GPT-5思维模型每周3000条消息使用限制解读

OpenAI 近期在社交媒体上正式宣布了针对其最新思维模型 GPT-5 的新使用限制政策，这一举措主要回应用户群体对于成本效益和利润分配的普遍担忧。OpenAI 首席执行官萨姆・阿尔特曼（Sam Altman）通过 X 平台公开确认，将从下周起为 Plus 会员实施每周3000条消息的互动限制，此举旨在显著提升推理模型的使用效率。据官方介绍，这一新规将使 G...

11:10

昆仑万维Matrix-Game2.0开源世界模型实时生成分钟级高连贯视频

【AIbase 报道】2023年8月12日，昆仑万维在其 SkyWork AI 技术发布周上，隆重推出了全新自研的交互式世界模型——Matrix-Game2.0。这一里程碑式的升级版本，不仅刷新了行业对开源世界模型的认知，更标志着昆仑万维在多模态AI领域的重大突破。作为Matrix系列的进化之作，Matrix-Game2.0开创性地实现了通用场景下的实时长序...

11:10

字节跳动DiT大模型打造视频字幕无痕擦除方案助力短剧出海

字节跳动技术团队重磅发布一项革命性创新技术——基于DiT大模型与字体级分割的视频字幕无痕擦除方案，旨在为短剧等视频内容的全球化传播注入强大动力。这一技术彻底突破了传统字幕擦除方法的瓶颈，为短剧出海、跨境电商等新兴领域开辟了全新的技术路径。在全球化内容制作过程中，原始视频中的中文字幕对海外观众而言不仅毫无意义，反而严重干扰观看体验。传统的字幕添加或通过马赛克...

11:09

360智脑Light-IF系列模型突破复杂指令遵循能力

360智脑团队正式发布革命性Light-IF系列模型，这一创新框架致力于突破大型语言模型（LLM）在复杂指令遵循方面的瓶颈。尽管当前AI技术在数学、编程等领域已展现出惊人的推理能力，但在处理复杂指令时仍存在明显短板。为攻克这一难题，360智脑团队研发出以预览-自检式推理与信息熵控制为核心技术的Light-IF框架。该框架通过五大关键技术环节协同作用，全面提升...

11:09

机器藏羚羊可可西里零干扰观测科技助力野生动物保护

在海拔4800米以上的可可西里无人区深处，卓乃湖畔上演了一幕科技与自然的和谐交融。一只由杭州云深处科技绝影 X30四足机器人精心改造而成的“机器藏羚羊”，悄然融入藏羚羊群，与它们一同踏上迁徙的征程。这一创新性的探索不仅突破了人类观测野生动物的传统距离限制，更为藏羚羊行为研究提供了前所未有的精准、可靠数据支持，为守护这片“人类禁区”注入了强大的科技力量。该项...

11:09

Meta豪购AI语音新锐WaveForms 加码音频AI布局

Meta 近期再下一城，成功收购了 AI 语音领域的创新先锋 WaveForms 公司，不过此次交易的具体金额尚未公布。这一举动不仅标志着 Meta 在人工智能领域的持续发力，更是其旗下新兴 AI 部门 Superintelligence Labs 的最新战略布局。值得注意的是，这已是 Meta 在一个月内完成的第二笔 AI 音频领域的重大并购，上个月该公司...