字节跳动视觉大模型团队近期迎来重要人事调整,引发广泛关注。团队负责人杨建朝在内部宣布将"暂时休息",由周畅接任新职位。这一变动不仅受到字节跳动内部的高度关注,更在外界引发了对公司未来技术战略稳定性的深入探讨。
杨建朝在官方公告中解释了此次决定,称主要出于家庭因素和工作压力的考虑。他明确表示,健康与家庭生活成为自己做出选择的决定性因素。值得注意的是,尽管杨建朝...
分类: AI动态
2025年07月18日
Moonshot AI开源模型Kimi K2在编程能力测试中表现惊艳,其性能与Qwen3-235B-A22B不相上下,更接近o3-mini-high和Claude-3.7-Sonnet的水平,这一突破性成果由权威基准测试平台Aider Leaderboard最新揭晓。凭借卓越的性价比和高效性能,Kimi K2迅速成为开发者构建终端编码Agent的热门选择,引...
NVIDIA重磅推出Canary-Qwen-2.5B模型,这一突破性创新融合了自动语音识别(ASR)与大型语言模型(LLM)技术,以惊人的5.63%词错率(WER)强势登顶Hugging Face OpenASR排行榜榜首。该模型采用CC-BY许可协议,兼具商业授权与开源特性,为企业级语音AI发展扫清了重重障碍。
技术突破:统一语音理解与语言处理
此次发布标...
人工智能技术的迅猛发展正为智能Agent的训练领域注入前所未有的活力。近日,一款名为ART(Agent Reinforcement Trainer)的开源强化学习框架正式问世,迅速在开发者社群中掀起热潮。该框架创新性地集成了GRPO技术,为Python开发者提供了强大而便捷的工具,能够高效训练AI Agent执行复杂的多步骤任务,例如精准的邮件搜索和智能化的...
Suno 正式推出其 AI 音乐生成模型的最新版本 v4.5+,为全球音乐创作者带来了革命性的创新体验。此次重大更新不仅显著提升了音质与生成速度,更首次实现了备受期待的人声替换功能,极大地增强了音乐创作的灵活性与个性化表达。这一突破性进展,正重新定义着音乐创作的边界与可能性。
人声替换功能:从伴奏到完整歌曲的飞跃
Suno v4.5+ 引入了三项核心功能,其...
最新数据显示,今年以来Steam平台上公开披露使用生成式AI技术的游戏数量激增了惊人的800%。这一显著增长清晰地表明,生成式AI正在迅速渗透游戏开发领域,成为行业创新的重要驱动力。根据Totally Human对Steam游戏库的深入分析,目前已有近8000款游戏在其官方说明中明确提及应用了生成式AI技术。这一数字与一年前的1000款相比,呈现爆发式增长,...
Traycer作为一款专为Visual Studio Code(VSCode)打造的AI编程助手工具,正迅速在开发者社群中赢得广泛关注。这款由TraycerAI精心研发的VSCode插件凭借其卓越的任务拆解、代码规划与实时分析能力,显著提升了开发者的编码效率,尤其在驾驭大型代码库时展现出惊人的性能表现。
核心功能:从任务到代码的智能转化
Traycer通...
Slack 正在全面升级其人工智能功能,致力于打造更智能的工作空间,将消息平台升级为企业生产力的核心引擎。这一系列创新举措不仅将极大简化日常协作任务,更标志着其母公司 Salesforce 对微软在工作场所 AI 领域主导地位的直接挑战。未来几个月内,Slack 将陆续推出一系列革命性更新,包括直接嵌入画布的 AI 写作助手、实时上下文消息解释、自动化行动项...
近日,OpenAI发布了一份重要报告,其召集的顾问委员会在文中强烈呼吁继续由非营利组织主导人工智能技术的研发与监管。报告指出,当前正在加速发展的人工智能技术对人类未来具有决定性影响,因此必须确保其发展方向始终服务于公共利益。这份报告不仅为OpenAI的非营利组织架构提供建议,更描绘了人工智能民主化与慈善事业深度改革的宏伟蓝图。
顾问委员会召集人丹尼尔·津盖尔...
OpenAI正式发布ChatGPT Agent,这款全新AI工具标志着人工智能从对话助手向自主任务执行者的重大飞跃。ChatGPT Agent整合了此前OpenAI推出的Operator和Deep Research功能,能够通过虚拟浏览器、终端和API访问,自主完成复杂任务,为用户节省时间并提升效率。
核心功能:从对话到行动
ChatGPT Agent不再局...
近日彭博社记者马克・古尔曼独家披露,科技巨头Meta(原Facebook)再次从苹果公司成功挖角两名核心AI专家,进一步巩固其在人工智能领域的领先地位。这一消息迅速引发行业震动,因为不久前Meta刚刚以超过2亿美元的惊人薪酬从苹果挖走了AI部门主管庞若鸣(Ruoming Pang)。据多方知情人士透露,这两位新加入Meta超级智能实验室(Superintel...
在刚刚落幕的第三届链博会上,朗新科技集团震撼发布了自主研发的“朗新九功AI能源大模型”,这一突破性成果迅速成为行业焦点。作为朗新科技的核心战略产品,该模型融合了“时序预测”与“AI智能体”两大尖端技术,展现出颠覆性的智能化应用潜力。
“时序预测”引擎是朗新九功的基石技术之一。该引擎依托海量的高质量预训练数据,构建了千亿级别的预测模型。特别是在电力现货市场领域...
近日,在宾夕法尼亚州隆重举行的首届能源与创新峰会上,美国前总统特朗普震撼宣布了一项总额高达900亿美元的巨额投资计划,旨在将宾夕法尼亚州打造成为美国人工智能领域的核心枢纽。这一战略投资不仅覆盖了数据中心的建设,还涵盖了能源基础设施的升级以及人工智能相关人才的培养,为宾夕法尼亚州的未来发展注入强劲动力。图源备注:图片由AI生成,图片授权服务商Midjourne...
Mistral AI 的旗舰聊天机器人 Le Chat 近期迎来了一次突破性升级,通过新增五项核心功能,大幅提升了用户交互体验和适用场景的广度。此次升级特别整合了多种先进模型,包括专用于语音交互的 Voxtral 模型以及擅长逻辑推理的 Magistral 模型,为用户带来更加智能化的服务。
深度研究模式:高效信息整合利器
本次更新的最大亮点是深度研究模式的...
近日,全球首个人工智能直播流扩散(Live-Stream Diffusion,LSD)模型MirageLSD正式问世,其卓越的实时视频转换能力迅速引爆行业关注。这款由Decart AI团队倾力打造的创新模型,以惊人的速度将任意视频流实时转化为用户心仪的场景,为直播、游戏开发、动画制作及虚拟换装等领域开辟了前所未有的新天地。不到40毫秒的超低延迟,24帧/秒的...
加州科技公司 Anthropic 正陷入一场备受瞩目的集体诉讼风波中 三位作家以侵犯版权为由提起诉讼 指控该公司未经授权允许他们的作品被盗版图书馆下载 用于训练聊天机器人 Claude 周四 联邦法官作出关键裁决 允许作家们代表所有受影响的美国作家集体起诉 这一判决被视为对人工智能行业版权问题的重大审视
据诉讼文件披露 Anthropic 通过类似早期音...
谷歌最新推出的旗舰级AI视频生成模型Veo3,现已通过Gemini API正式向开发者开放,为文本转视频功能注入强大动力,并支持同步音频生成。这一创新举措标志着AI视频制作技术迈入全新发展阶段,同时也带来了更高的成本考量。Veo3作为谷歌首款能够通过单一文本提示生成高分辨率视频,并同步创作对话、音乐及音效的模型,展现了惊人的技术实力。目前,Gemini AP...
2025年07月17日
字节跳动旗下豆包大模型视觉多模态方向的负责人杨建朝正式宣布将暂时休息,并已顺利交接相关工作。这一重要人事调整意味着原阿里巴巴M6大模型技术负责人周畅(花名“时光”)将接任该职位,继续带领Seed视觉模型团队,向谷歌DeepMind前副总裁吴永辉汇报工作。此次高层变动在业界引发广泛关注,不少业内人士开始关注字节AI核心技术团队的稳定性。
据悉,杨建朝选择暂时离...
近日,一则重磅消息在科技界引发广泛关注:人工智能公司 Anthropic 的估值已实现惊人飞跃,最新估值高达1000亿美元,较四个月前的580亿美元几乎翻了一番。这一令人瞩目的增长主要得益于 Anthropic 近期向部分投资者披露的亮眼财务数据,尤其是其2023年上半年年化收入实现四倍爆发式增长,突破40亿美元大关。为持续推动这一强劲势头,Anthropi...
特斯拉CEO埃隆·马斯克近日宣布了一项重要更新,公司正为其车载AI助手Grok新增“Hey Grok”语音唤醒功能。这一创新意味着车主们无需再手动操作即可唤醒Grok,只需简单说出唤醒词“Hey Grok”即可轻松激活这一智能助手。
上周,特斯拉正式将Grok助手引入旗下汽车,车主们可以通过车载应用启动器或长按方向盘上的语音键来启动该助手。尽管Grok助...
德国马克斯・普朗克人类发展研究所近期开展的一项前沿研究,为我们揭示了人工智能正以显著方式重塑人类语言。这项研究聚焦于ChatGPT等AI聊天机器人的深远影响,发现"AI词汇"正悄然渗透我们的日常交流。研究团队通过创新方法,将数百万篇人类原创文本——涵盖电子邮件、学术论文及新闻报道等多元形式——输入ChatGPT进行"智能润色",从而精准捕捉AI的语言偏好。经...
MiniMax正加速推进其资本化战略,据新浪财经独家披露,这家中国领先的AI大模型创业公司已悄然向香港交易所递交IPO申请,目标估值高达40亿美元,同时也在积极筹备A股上市计划。这一潜在上市行动被视为国内AI独角兽企业进军国际资本市场的又一重要里程碑。
最新公开数据显示,MiniMax刚刚完成一轮近3亿美元的新融资,投后估值已突破40亿美元大关。本次融资由上...
AI编码工具Windsurf正式宣布,其平台已成功重新上线Anthropic的Claude Sonnet4模型,为付费用户提供直接访问权限。这一重要更新标志着Windsurf在与Anthropic的合作经历波折后,成功恢复了对其前沿AI模型的支持,为开发者社区带来了新的机遇。
Claude Sonnet4重返Windsurf,功能全面开放
根据X平台上的最新...
近日,美国知名编程助手 Cursor 官方突然宣布将限制部分区域用户的模型访问权限,并同步启动了相应的退款流程。这一突发举措迅速引发了全球开发者的广泛关注,大量用户开始转向备选方案,其中月之暗面推出的 Kimi K2 大模型平台成为最大赢家。根据 OpenRouter 最新披露的数据,Kimi K2 的日均调用量已突破100亿 token,与马斯克旗下新发布...
小米在智能汽车领域再创佳绩,全新推出“快捷找车”功能,为车主解决停车后找车的难题。该功能首批搭载于小米YU7车型,通过App的简单设置,让找车过程变得前所未有的便捷。随着城市生活节奏的加快,大型商场和写字楼停车场中找车的困扰已成为许多车主的痛点。小米敏锐洞察这一需求,创新性地推出了这一实用功能。
用户只需在小米汽车App中开启“自动拍照”选项,车辆锁车时便会...
在人工智能领域竞争日趋白热化的今天,AI 初创公司 Anthropic 正凭借其卓越表现吸引着越来越多投资者的目光。据行业内部消息透露,Anthropic 的最新估值已突破1000亿美元大关,较四个月前的580亿美元实现了近乎翻倍的惊人增长。这一估值跃升主要源于 Anthropic 近期向部分投资者披露的亮眼财务数据,尤其是其2023年上半年年化收入增长了四...
在人工智能技术的飞速发展中,大型语言模型(LLM)凭借其卓越的自然语言处理能力成为研究热点,然而高昂的计算和内存需求限制了其在实际场景中的应用。为了破解这一技术瓶颈,谷歌 DeepMind 创新性地提出了 Mixture-of-Recursions(MoR)架构,这一突破性设计有望颠覆传统 Transformer 模型的主导地位。MoR 架构在递归 Tran...
OpenAI 近期在 macOS 平台推出了一项令人瞩目的创新功能——ChatGPT 音频录制与转录模式,为付费用户带来了前所未有的音频处理体验。这一功能专为高效工作场景设计,能够精准记录并分析会议录音、头脑风暴讨论以及个人语音笔记等多样化音频内容。自6月初发布更新预告以来,该功能便引发了广泛关注和期待。然而目前该功能仅面向 macOS 系统的 GPT-4o...