苹果加速LLM研发,豪掷千金引谷歌人才

苹果正全力冲刺大语言模型(LLM)领域,据The Information报道,公司已大幅增加研究经费,每天烧掉数百万美元,并从谷歌挖来众多工程师。苹果内部员工自信满满地表示,他们的Apple GPT大模型能力已超越GPT-3.5。而Siri也即将迎来重大升级——只需简单指令,它就能自动处理照片创建GIF并发送给朋友,无需用户触碰屏幕。这场LLM领域的激烈竞争已悄然展开,苹果作为科技巨头,必将成为这场战役的重要参与者。

AI负责人不甘落后,苹果曾有机会成为OpenAI

四年前,苹果AI主管John Giannandrea组建团队开发对话式AI,展现远见,但仍是慢一步——OpenAI去年秋季发布的ChatGPT已引起全球关注。苹果内部人士透露,公司其实早有准备,但Giannandrea曾质疑AI聊天机器人的实用价值。如今,苹果决心不惜代价打造LLM,弥补先机之失。

16人核心团队,多路并进攻克LLM难题

苹果为LLM研发投入巨大,尽管团队仅有约16人,但训练模型预算已增至每天数百万美元。该团队由从谷歌挖来的工程师组成,由Ruoming Pang领导,他在谷歌工作15年后于2021年加入苹果。知情人士表示,该团队类似谷歌和Meta的AI实验室,研究人员开发模型,其他部门负责产品应用。

除了Foundational Models团队,苹果至少还有两个团队从事语言和图像模型开发。视觉团队专注于图像、视频和3D场景生成应用,多模态团队则研究同时识别和生成图像、视频及文本的AI。目前,苹果已开发多个模型,正紧锣密鼓进行内部测试。

Siri即将迎来革命性升级,但苹果面临技术挑战

苹果团队认为,最先进的Ajax GPT(Apple GPT)已超越GPT-3.5。有了如此强大的语言模型支持,苹果产品将迎来大升级。例如,通过简单指令,Siri就能自动创建GIF并发送,而Shortcuts应用将允许用户手动编程串联不同app功能。预计明年iOS新版本将上线这些功能。但苹果如何在产品中应用LLM仍无定论,考虑到用户隐私保护,苹果更倾向于设备端离线运行。知情人士透露,Apple GPT参数量已超2000亿,这对iPhone的算力和存储都是巨大考验。谷歌PaLM 2的分层模型设计为苹果提供了借鉴。

苹果变得更”谷歌”,但人才策略独具匠心

Giannandrea加入苹果后,大力推动AI发展,并从谷歌挖来多位骨干工程师。他还在苹果内部推广谷歌云服务和TPU芯片训练模型。苹果给予员工高度自由的研究环境,这与此前严格的限制形成鲜明对比,从而吸引人才回流。Foundational Models团队的前身是Arthur Van Hoff领导的团队,后者曾参与Java开发。团队核心成员包括牛津大学研究员Tom Gunter和Thomas Nickson,以及从谷歌挖来的Ruoming Pang、Daphne Luong和Samy Bengio。不过,Van Hoff已于今年8月离职,而Jon Shlens在加入苹果不到两年后重返谷歌。

苹果选择谷歌云服务,但人才流动频繁

苹果机器学习组在OpenAI发布GPT-3后曾要求增加资金,但高管为控制成本仍鼓励使用价格更低的谷歌云服务。尽管如此,苹果从未停止从谷歌和Meta挖人,据统计已有至少12名新成员为苹果机器学习团队做出贡献,其中7人曾任职于谷歌或Meta。

苹果意外开源,AXLearn框架引发关注

受Ruoming Pang影响,Foundational Models团队于今年7月将训练Ajax GPT的机器学习框架AXLearn开源至GitHub。AXLearn基于谷歌开源框架JAX和XLA,可快速训练机器学习模型并针对谷歌TPU优化。该项目采用面向对象方法解决模型构建、迭代和维护的软件工程挑战,支持在数千个加速器上训练数百亿参数模型,涵盖自然语言处理、计算机视觉和语音识别等应用。尽管苹果未公开训练数据,但AXLearn的开源表明公司希望促进技术共享和改进。

最新快讯

2025年08月10日

16:09
微新创想8月10日讯 OpenAI于8日凌晨正式发布了其迄今为止最强大的人工智能模型GPT-5。然而新模型上线后不久便遭遇了用户的大量吐槽,使用体验远未达到预期。本周OpenAI又发布了全新升级的GPT-5系列,同时宣布淘汰多款旧版AI模型,这一决定引发了部分用户的强烈不满和反弹。 在外国论坛Reddit的ChatGPT讨论区,不少用户表达了强烈不满。有人愤...
16:09
微新创想8月10日重磅消息,华为即将在8月12日举办的2025金融AI推理应用落地与发展论坛上,重磅发布AI推理领域的革命性技术突破。据行业深度消息透露,这一突破性成果有望从根本上降低中国AI推理对HBM(高带宽内存)技术的依赖,显著提升国内AI大模型推理性能,并完善中国AI推理生态的关键环节。 HBM(High Bandwidth Memory,高带宽内存...
16:09
2025年上半年,佰维存储的财务表现呈现出显著的盈利挑战。尽管公司营业收入实现了13.70%的同比增长,达到39.12亿元,但净利润却出现了大幅下滑,净亏损额度高达2.26亿元。这一数据揭示了公司在扩大营收规模的同时,盈利能力并未得到有效提升,经营状况仍面临较大压力。 从行业角度来看,佰维存储的营收增长表现尚可,但亏损扩大的情况不容忽视。这表明公司在成本控制...
16:09
北京时间8月10日14时59分,一场6.0级地震在堪察加半岛东南沿岸海域悄然发生,震源深度达到33公里。这一地质活动虽然释放了能量,但幸运的是并未对当地造成人员伤亡或财产损失。 据俄罗斯科学院‘统一地球物理局’堪察加分部发布的官方消息,此次地震发生在远离陆地的海域区域。专家分析指出,由于震源深度相对较浅,地震波在传播过程中能量有所衰减,这也是目前未观察到明显...
16:09
2025年8月10日,工业富联正式发布其备受瞩目的半年度财务报告,数据显示公司上半年经营表现亮眼。报告显示,工业富联实现营业收入高达3607.60亿元,相较于去年同期大幅增长35.58%,这一成绩彰显了市场需求的强劲复苏态势。在盈利能力方面,公司上半年净利润达到121.13亿元,同比增长率高达38.61%,创历史新高。这一显著的经营业绩提升,主要得益于两大核...
16:09
2025年8月10日,佳创视讯(股票代码:300264.SZ)正式发布重要公告,宣布公司控股股东陈坤江已与毛广甫、李莉夫妇签署《控制权变更框架协议》。根据协议内容,若相关交易顺利达成,佳创视讯的实际控制人将迎来重大转变,由陈坤江变更为毛广甫与李莉夫妇。这一变动不仅标志着公司股权结构的深刻调整,更可能对公司未来的战略发展方向和经营业绩产生深远影响。为配合此次控...
16:09
四川盆地近日强降雨持续不断,国家防汛总指挥部于8月10日14时紧急启动防汛四级应急响应,以应对严峻的汛情形势。据气象部门最新预报,8月10日至12日期间,四川盆地将迎来中到大雨天气,局部地区更可能出现暴雨乃至大暴雨的极端天气,中央气象台已于10日10时正式发布暴雨黄色预警,提醒公众做好防范准备。 此次防汛四级应急响应的启动,充分体现了国家防总对四川盆地汛情的...
16:09
2025年8月10日,清华大学计算机科学团队传来振奋人心的消息,他们成功突破了一项尘封四十年的最短路径算法纪录,这一里程碑式的成果为计算机科学领域带来了革命性的影响。最短路径问题作为计算机科学中的核心难题之一,在现实世界的应用场景极为广泛,从导航软件的路线规划到物流运输的路径优化,再到网络通信的数据传输,其高效解决方案都直接关系到行业效率的提升。此次突破不仅...
16:09
2025年8月,黑龙江省鹤岗市正以惊人的速度摆脱“白菜价”房源的标签,向高端楼市转型。这一转变在近日开售的向阳区新楼盘中得到了充分体现,该楼盘迅速引发广泛关注,吸引来自全国各地的游客前来选购。鹤岗的楼市复苏并非偶然,而是产业转型与生态价值双重推动的结果。当地新建的多个智慧社区,不仅提升了城市品质,更标志着鹤岗正迈向高质量发展之路。这一系列变化,不仅让鹤岗重新...
16:09
2025年8月10日,中国铁路乌鲁木齐局集团公司传来喜讯,最新数据显示,截至8月8日,霍尔果斯铁路口岸今年中欧(中亚)班列通行量已强势突破6000列大关,这一成绩不仅刷新了年度历史记录,更令人瞩目的是,相较于去年同期,通行时间整整提前了46天,展现出惊人的发展速度和效率。这一里程碑式的突破,不仅彰显了我国铁路运输体系的强大实力,也凸显了霍尔果斯口岸作为国际物...
15:05
8月10日,我国在隧道与地下空间领域迎来重大突破,首个垂直大模型正式问世。这一创新成果由中国中铁隧道局隧道掘进机及智能运维全国重点实验室自主研发,其技术体系建立在海量工程数据之上,依托773条工程线路和1200亿条建造数据,实现了对复杂地下环境的精准解析与智能建模。作为我国在该领域的里程碑式成果,该模型不仅填补了国内空白,更为全球隧道建设提供了全新的技术范式...
15:05
8月10日清晨7时25分,印尼北马鲁古省的杜科诺火山突然喷发,火山灰柱直冲高空约800米,喷发过程持续了整整62.38秒。这一突发性火山活动已将火山警戒级别提升至二级,意味着火山活动正处于活跃状态,存在进一步喷发的可能。根据火山监测部门的紧急通知,所有居民和游客被强烈建议远离火山口周边4公里半径的警戒区域,以避免火山灰、熔岩碎屑以及其他危险物质带来的潜在威胁...