快手开源KAT-V1大模型：40B版本性能逼近DeepSeek-R1-0528 - 微新创想

2025-07-25 12:03:09 AI动态 71 次阅读

快手公司隆重宣布正式发布并开源其自主研发的 KAT-V1 自动思考（AutoThink）大模型。这款创新模型在思考与非思考能力的融合方面展现出卓越表现，能够根据问题的复杂度智能调整思考模式，实现更高效的人机协作。KAT-V1 提供两个版本：40B 和 200B，其中性能表现突出的 40B 版本在自动思考模式下的性能已接近最新发布的 DeepSeek-R1（参数量为 6850 亿），而 200B 版本则在多项基准测试中超越了 Qwen、DeepSeek 和 Llama 系列的旗舰模型。

显著的性能优势
在实时基准测试 LiveCodeBench Pro 中，KAT-V1 的 40B 版本表现优异，成功跻身闭源模型行列，超越了众多开源模型。快手的 Kwaipilot 团队在技术报告中详细阐述了 KAT-V1 背后的多项技术创新，包括一种全新的长短思考混合模型训练范式，以及一种新型强化学习算法 Step-SRPO，这些技术显著提升了模型的推理能力和思考密度。

快手开源KAT-V1大模型：40B版本性能逼近DeepSeek-R1-0528插图

解决过度思考的问题
自 OpenAI 推出 o 系列模型以来，推理模型的思考方式逐渐演变为“过度思考”，导致响应时间延长，用户体验下降。KAT-V1 针对这一问题进行了优化，研究团队希望模型能够根据任务复杂度自主判断是否进行深入思考，从而实现更高效的人机协作。快手团队在今年 6 月推出的 KwaiCoder-AutoThink-preview 为解决此问题提供了初步方案，KAT-V1 在此基础上进行了进一步的推理能力优化。

创新的数据处理与模型蒸馏技术
KAT-V1 模型是在 Qwen2.5-32B 的基础上进行扩展的。团队构造了大量的思考与非思考数据，并在预训练阶段使用了约 1000 万个示例，以确保模型在科学、代码、数学等多个领域的能力泛化。通过独特的异构蒸馏框架，KAT-V1 能高效地将教师模型的知识传递给学生模型，大大降低了模型初始化的成本。在模型的后训练阶段，Kwaipilot 团队通过强化学习方法提升模型的智能决策能力。KAT-V1 能够通过学习，智能选择合适的思考模式，使得在复杂问题上，其性能可以达到 DeepSeek-R1-0528 的 95% 以上。

快手开源KAT-V1大模型：40B版本性能逼近DeepSeek-R1-0528插图1

目前，KAT-V1 的 40B 版本已在 Hugging Face 平台上线，用户也可以在快手打造的 AI 研发助手 Kwaipilot 中体验这一模型。200B 版本的 MoE 模型仍在训练中，未来有望带来更强大的功能和应用。模型开源地址:https://huggingface.co/Kwaipilot/KAT-V1-40B 技术报告地址:https://arxiv.org/pdf/2507.08297

2026年03月04日

05:07

Meta成立新AI应用工程组织推动元宇宙技术落地

微新创想：2026年3月4日，Meta宣布成立Meta Applied AI工程组织，该组织隶属于Reality Labs部门。这一举措标志着Meta在推动人工智能技术实际应用方面迈出了重要一步，旨在加快AI技术在现实场景中的工程化落地。微新创想：新成立的组织将专注于AR/VR、智能助手以及沉浸式应用等多个关键领域。通过整合公司内部不同部门的AI研发资源，...

02:34

OpenAI发布GPT-5.3即时版全面开放ChatGPT用户免费体验

微新创想：2026年3月4日，OpenAI正式推出GPT-5.3即时版网站。该版本即日起面向所有ChatGPT用户免费开放使用。此前的GPT-5.2即时版仍保留在旧版模型选择器中，仅限付费用户访问，为期三个月，将于2026年6月3日终止服务。此次升级旨在提升响应速度与多模态理解能力，无需额外订阅即可体验最新模型。OpenAI未披露具体技术参数，但强调其在实...

02:34

ASM国际2025年四季度财报超预期多项指标亮眼

微新创想：2026年3月4日，荷兰半导体设备制造商ASM国际发布2025年第四季度财报。当季营收达6.98亿欧元，略高于市场预期的6.976亿欧元。这一成绩表明公司在全球半导体市场中继续保持强劲的盈利能力。订单额为8.028亿欧元，显著高于预期的7.726亿欧元。这显示出客户对ASM国际产品的持续高需求，尤其是在高端制造领域。订单积压也达到了12.5亿欧元...

01:25

阿波罗CEO预警私募信贷市场将迎结构性洗牌

微新创想：2026年3月4日，阿波罗全球管理CEO Marc Rowan警示私募信贷市场面临结构性洗牌。当前软件公司贷款违约率上升，叠加人工智能潜在冲击软件行业，引发投资者对1.8万亿美元私募信贷资产质量的担忧。商业发展公司近期遭遇赎回潮，高管持续回应质疑。此次压力源于底层资产集中度高、估值透明度低及利率环境变化等多重因素。行业正加速分化，风控能力薄弱机构...

00:40

中兴MWC26首发AI原生手机努比亚M153及情感陪伴AI产品iMoochi

微新创想：3月2日，中兴通讯在西班牙巴塞罗那举行的2026年世界移动通信大会（MWC26）上，正式发布了其首款AI原生手机努比亚M153以及豆包手机助手预览版。这一发布标志着中兴在人工智能领域的重要突破。努比亚M153搭载了骁龙8至尊版芯片，具备强大的计算能力，能够支持自然语言跨应用的多步任务执行，为用户带来更加智能和高效的使用体验。微新创想：与此同时，中...

00:40

KDE Plasma 6.6.2正式发布稳定性修复与体验优化全面升级

微新创想：2026年3月3日，KDE团队正式发布桌面环境Plasma 6.6.2。该版本作为Plasma 6.6系列的第二个错误修复更新，主要针对显示子系统、远程桌面组件KRdp以及应用商店Discover进行了稳定性提升和交互优化。此次更新解决了多个关键问题，包括DRM后端崩溃、镜像输出异常、KRdp中的线程安全与死锁问题，同时改善了Discover的悬停...

2026年03月03日

23:48

李开复回应Anthropic指控中国AI蒸馏技术合规性争议

微新创想：3月3日，零一万物CEO、创新工场董事长李开复在微博视频中回应了Anthropic指控中国公司蒸馏其AI模型一事。他明确表示模型蒸馏是AI领域常见的技术手段，并不违反任何规则。李开复认为Anthropic对此事的反应过于激烈，质疑其立场存在偏颇。李开复还提到Anthropic曾因盗版数百万册图书被美国作家公会起诉，最终需赔偿15亿美元。其中涉及的...

23:07

三星Galaxy S26全系8Bit色深澄清 1600万色实测无断层

微新创想：2026年3月3日，三星就Galaxy S26系列屏幕色深问题作出澄清：S26 Ultra、S26+及S26标准版均搭载8Bit色深显示屏，非此前沟通会所称的10Bit。这一澄清迅速引发了消费者的关注与讨论。三星中国官网参数亦显示S26 Ultra屏幕色彩为“1600万色”，印证8Bit规格。尽管官方确认屏幕为8Bit色深，但部分用户在实际使用中...

23:07

郑州打造世界培育钻石之都加速产业价值跃升

微新创想：3月3日，河南省委常委、郑州市委书记安伟在郑州主持召开专题会议，研究培育钻石产业链发展。会议强调要全面落实省委、省政府的部署，聚焦延链补链强链，以开放合作和加工带动为路径，强化生态培育与科技支撑，推动产业由产能高地向价值高地跃升。微新创想：此次会议明确指出，郑州将致力于打造成为‘世界培育钻石之都’。这一目标不仅体现了对本地产业发展的高度重视，也展...

23:07

12306回应旅客躺座位下睡觉危险行为不建议

12306回应旅客躺座位下睡觉危险行为不建议

微新创想近日，在西安开往广州东的K731次列车上，发生了一件让乘客张先生意外的事情。一名大爷在车厢内站久了，因身体疲惫而蜷缩在座位下方睡着了。张先生回忆，当时车厢内十分拥挤，他无意中动了下脚，碰到了大爷的头，这才发现脚边躺着一个人，顿时感到惊讶和不知所措。微新创想针对这一事件，12306客服作出了回应。客服表示，持有无座票的旅客可以在无人座位上短暂休息...

23:07

蔚来ES9技术发布会4月9日开启 11年创新成果全面亮相

蔚来ES9技术发布会4月9日开启 11年创新成果全面亮相

微新创想：蔚来创始人、董事长、CEO李斌在元宵节直播中宣布，蔚来ES9技术发布会将于4月9日正式举行。李斌表示，这是今年市场上技术最先进的SUV，更是蔚来11年技术创新的集大成之作。据介绍，ES9搭载了首个获得国家量产许可的线控转向系统天行线控转向。这一技术的引入，标志着蔚来在智能驾驶领域迈出了重要一步。同时，新车还配备了全球首个集成式液压全主动悬架系统天...

23:07

巨型汤圆走红网络网友误认馒头古称与寓意揭秘

巨型汤圆走红网络网友误认馒头古称与寓意揭秘

微新创想：3月3日消息元宵佳节吃汤圆是各家各户必不可少的传统习俗最近一段关于巨型汤圆的视频走红网络博主乡村妈妈展示了自家制作的特大号汤圆其个头硕大如馒头普通瓷碗只能勉强装下一个许多网友在看到视频后纷纷留言表示第一眼看过去还以为是刚出锅的大馒头完全没想到这竟然是汤圆大家调侃道这么扎实的汤圆吃上一个恐怕得直接撑上一整天翻阅历史资料可以发现汤圆在古代有着非常丰...