随着秋意渐浓,人工智能领域正掀起一场激烈的多模态模型之争。谷歌与OpenAI两大巨头在这场技术较量中展开了白热化竞争。就在不久前,谷歌向部分外部企业开放了其多模态大模型Gemini的试用权限。面对谷歌的强势出击,OpenAI显然不会甘居人后,正全力以赴将多模态功能整合进GPT-4,力求推出与Gemini媲美的多模态大模型,一举在AI领域占据制高点。

多模态技术的震撼亮相,可追溯至今年3月OpenAI的GPT-4发布会。当时,Greg Brockman亲自演示了这一神奇功能:只需在纸上画个草图,再拍张照片发送给GPT-4,并下达指令”按照这种布局做个网站”,系统便会迅速生成相应的网页代码。这一演示震惊了全球科技界,然而多模态功能此后却仿佛昙花一现,再未出现产品化的实际应用。如今,谷歌与OpenAI的多模态大战,终于拉开帷幕?

面对传闻中谷歌即将推出的这款”大杀器”,OpenAI显然不敢怠慢。据外媒The Information独家爆料,OpenAI正在紧锣密鼓研发一款代号为Gobi的新一代多模态大模型,计划在Gemini正式发布前抢占先机,以彻底击败谷歌。OpenAI的Greg Brockman与谷歌的Demis Hassabis,这两位AI领域的领军人物,正带领各自团队展开激烈角逐。

OpenAI在3月份推出GPT-4多模态功能后,已向Be My Eyes公司展示了这项技术,但尚未向其他企业开放。Be My Eyes公司专注于研发帮助视障人士改善视力的技术,这一合作显示出OpenAI对多模态应用场景的积极探索。近期,OpenAI计划更广泛地推出名为GPT-Vision的功能,但此前因担心视觉功能被不法分子利用(如自动破解验证码、追踪人类面部等)而有所延迟。不过,据称OpenAI的工程师们已解决了这些法律风险问题。谷歌方面同样重视安全防控,一位谷歌发言人表示,公司已采取措施防止Gemini被滥用,并承诺在所有产品中开发负责任的人工智能。

关于Gobi是否会成为传说中的GPT-5,目前尚无确切答案。与GPT-4不同,Gobi从一开始就是作为多模态模型设计的。DeepMind联合创始人、现Inflection AICEO Mustafa Suleyman在9月初的采访中透露,OpenAI正在秘密训练GPT-5,并暗示Sam Altman关于”没有训练GPT-5″的说法可能并不属实。尽管如此,Gobi的训练进度目前仍属保密。

另一方面,谷歌也在积极备战。据The Information报道,Gemini可能很快将进行测试发布,并集成到Google Cloud Vertex AI等服务中。在今年的谷歌I/O开发者大会上, Sundar Pichai曾详细介绍Gemini的多模态特性、高效集成工具和API功能。为了合力攻关,谷歌将谷歌大脑与DeepMind实验室合并,至少20位高管参与研发,包括DeepMind创始人Demis Hassabis和谷歌创始人Sergey Brin。DeepMind的数百名员工,包括前谷歌大脑主管Jeff Dean等顶尖人才,也加入了这一项目。

一位测试过Gemini的人士表示,该模型在理解用户意图方面比GPT-4更胜一筹,因为它不仅利用了公开网络信息,还整合了大量谷歌消费产品(搜索、YouTube)的专有数据。因此,Gemini产生的错误答案(即幻觉)似乎更少。据SemiAnalysis分析师爆料,Gemini已开始在算力高达~1e26 FLOPS的新TPUv5 Pod上进行训练,比GPT-4的训练算力高出5倍。其训练数据库包含YouTube上936亿分钟的视频字幕,总数据集规模约为GPT-4的两倍。据悉,谷歌下一代大模型可能采用MoE架构和投机采样技术,通过小模型提前生成token并传递给大模型进行评估,从而提高整体推理速度。

Gemini预计将花费数千万至数亿美元开发,与GPT-4的成本相当。DeepMind负责人Hassabis表示,Gemini将整合AlphaGo中使用的技术,将AlphaGo系统的规划、解决问题的能力与大语言模型的惊人语言能力相结合。此外,Gemini还将引入其他创新技术,包括DeepMind首创的强化学习技术。通过强化学习,AI能够通过反复尝试和接受反馈来调整自身表现,从而学会处理复杂问题。AlphaGo还使用了蒙特卡洛树搜索(MCTS)方法探索所有可能的棋盘动作,这些技术都将应用于Gemini的开发中。

谷歌希望Gemini能大幅提升软件开发人员的代码生成能力,以追赶微软的GitHub Copilot代码助手。内部讨论还涉及使用Gemini实现图表分析等功能,如解释图表含义、通过文本或语音指令浏览网页浏览器等。谷歌云开发者平台Google Cloud Vertex AI也将获得Gemini加持,支持大小版本,让开发人员可以在个人设备上运行付费购买的小模型。

在多模态模型竞赛中,OpenAI也不甘落后。7月,OpenAI宣布GPT-4 API全面可用,并计划在接下来几个月推出新模型。近日,许多用户收到了gpt-3.5-turbo-instruct新模型发布的邮件,替代了旧模型text-davinci-003。gpt-3.5-turbo-instruct是一款InstructGPT风格的模型,训练方式与text-davinci-003类似,采用提示词指令补全的方式使用。价格方面,gpt-3.5-turbo 4K保持与旧模型一致。有网友已开始使用最新模型进行国际象棋对弈,发现其表现令人惊叹。该模型轻松击败了Stockfish 4级(1700分),在5级(2000分)的比赛中仍保持强劲势头。它从不走非法棋步,善于使用开局牺牲,并展现出令人难以置信的卒与王将死技巧,允许对手毫无意义地晋级。网友使用PGN风格的提示模拟大师级游戏,发现纯Completion模型就取得了如此出色的表现。

值得一提的是,OpenAI即将在11月召开的首届开发者大会已经开始接受注册。这场多模态模型之争,不仅是技术实力的较量,更是AI发展方向的争夺。谷歌与OpenAI的这场AI版”iPhone与Android”对决,究竟谁将胜出?所有人都在屏息以待。

最新快讯

2025年12月20日

12:38
2025年12月20日,保时捷官方确认全新718 Boxster纯电版原型车正在进行第四轮冬季极寒测试。这款备受瞩目的电动跑车自2022年12月首次亮相路测以来,其研发周期已显著超出行业常规,创下保时捷品牌历史新纪录。最新测试车型在细节上展现出纯电身份的明确特征,包括采用四点式日间行车灯组、贯穿式尾灯设计以及尾部专属充电接口,这些设计元素不仅彰显了其电动化属...
12:38
2025年12月20日,特斯拉成功获得一项具有突破性意义的新专利(US 2025/0334856-A1),该专利针对自动驾驶系统中摄像头在强光环境下失效的难题提出了创新解决方案。这项技术通过采用微锥体三维阵列结构与超黑涂层相结合的方式,显著降低了整个半球反射率,有效防止外壳反光对成像质量造成干扰。此外,专利中还引入了机电调节遮光罩设计,能够根据光线变化动态调...
12:07
2025年12月19日,宝马M3纯电版(代号ZA0)的首次路测谍照意外曝光,瞬间引爆了汽车界的关注。这组珍贵的照片不仅揭开了基于全新Neue Klasse平台的量产车型神秘面纱,更让我们首次窥见了其极具辨识度的前大灯设计。新车采用了极具未来感的“双倾斜LED光带”设计,犹如两道凌厉的闪电划破夜空,不仅极大地提升了视觉冲击力,更预示着其在性能上的不凡表现。 根...
12:07
2025年12月20日,北京同仁堂集团在“南极磷虾油”相关舆论发酵后迅速作出反应,正式启动零容忍品牌严管行动。集团高层高度重视此事,第一时间成立了专项工作组,并已派员赶赴四川对涉事产品展开全面核查。此次行动将坚决一查到底,绝不姑息,旨在以最严格的监管标准维护品牌形象与消费者权益。为确保产品质量安全,同仁堂集团将采取全方位措施,从原料采购到生产加工再到市场流通...
11:37
12月20日8时30分起,受大雾、降雪及路面结冰等多重恶劣天气影响,我国辽宁、山东、河南、新疆等十余省份的国道、省道干线公路相继启动应急管控措施。据交通运输部门最新通报,此次天气影响范围广泛,已对多个重要交通枢纽路段实施临时封闭。 在辽宁、山东等四省,大雾天气尤为严重,已对14条重点路段采取管控措施。其中,9条路段实施主线封闭,5条收费站临时关闭,有效防止了...
11:37
资深制作人Rich Vogel近日向外界透露了一则关于《GTA 6》的惊人消息——这款备受期待的游戏或将深度融合MMORPG(大型多人在线角色扮演游戏)元素。Vogel凭借其在游戏行业的深厚资历,曾参与开发《网络创世纪》等多款经典网游,他对《GTA 6》的设想充满信心。尽管目前西方游戏厂商对MMO项目的投资普遍持谨慎态度,但Vogel坚信这款作品能够填补市场...
11:37
2025年12月19日,美国得克萨斯州奥斯汀市中心上演了一幕科技与未来交通的精彩演绎。一辆特斯拉Cybercab自动驾驶出租车在公开场合进行测试,吸引了众多目光。这辆双座智能座驾彻底颠覆了传统汽车的设计理念,没有方向盘和踏板,取而代之的是先进的自动驾驶系统。它搭载了特斯拉最新的AI4硬件平台,并运行着无监督的FSD(完全自动驾驶)软件,这一突破性进展标志着特...
11:37
2025年12月20日,俄罗斯航天局宣布一项备受争议的太空计划——利用国际空间站(ISS)中服役超过30年的现有舱段,构建全新的"俄罗斯轨道站"(ROS)。这一决策迅速引发国际社会广泛关注,部分专家尖锐批评其仅为应对资源短缺的权宜之计,缺乏长远战略考量。 据俄罗斯官方资料显示,该轨道站将主要整合国际空间站上已运行近三十年的俄罗斯舱段,包括"联盟"号对接舱、"...
11:37
2025年12月20日,知名数码博主@数码闲聊站率先爆料,一加品牌即将发布代号15T的新一代旗舰手机,该机型已正式进入关键配件试产环节,预示着距离正式发布仅一步之遥。据博主透露,这款备受期待的新机将采用一块6.3英寸的1.5K分辨率+165Hz超高刷新率小尺寸直屏,不仅视觉效果细腻流畅,更符合当下用户对便携性操作的追求。在机身设计上,15T将采用坚固的金属中...
11:37
2025年12月19日,拉瑞安工作室CEO Swen Vincke就《神界》开发中使用生成式AI引发的争议公开发表了详细回应。面对外界质疑,Vincke明确指出AI技术仅被应用于项目初期的创意构思、演示文稿制作以及占位文本等辅助性工作,并郑重承诺在最终发行版本中不会出现任何AI生成的成果。这一表态旨在消除市场疑虑,强调公司对游戏品质的严格把控。 此前有前员工...
11:36
12月19日,知名维修平台iFixit发布了三星Galaxy XR头显的深度拆解报告,揭示了这款虚拟现实设备在设计与维护方面的诸多细节。拆解显示,Galaxy XR采用了创新的紧凑型单层主板设计,这种结构不仅有效减轻了设备整体重量,更显著提升了用户的佩戴舒适感,使其在长时间使用时依然保持轻盈体验。此外,设备巧妙地运用了磁吸式面部配件和可拆卸的外置电池设计,极...
10:37
微新创想12月20日重磅消息,华为官方今日正式官宣,备受瞩目的华为Pura X新年礼遇活动盛大开启,最高优惠额度高达800元,让消费者以更惊喜的价格体验旗舰折叠屏魅力。根据华为官网最新公布的信息,目前华为Pura X的起售价已降至6899元,具体价格体系如下: 12GB 256GB版本:原价7499元,现优惠价6899元 12GB 512GB版本:原价799...