随着秋意渐浓,人工智能领域正掀起一场激烈的多模态模型之争。谷歌与OpenAI两大巨头在这场技术较量中展开了白热化竞争。就在不久前,谷歌向部分外部企业开放了其多模态大模型Gemini的试用权限。面对谷歌的强势出击,OpenAI显然不会甘居人后,正全力以赴将多模态功能整合进GPT-4,力求推出与Gemini媲美的多模态大模型,一举在AI领域占据制高点。

多模态技术的震撼亮相,可追溯至今年3月OpenAI的GPT-4发布会。当时,Greg Brockman亲自演示了这一神奇功能:只需在纸上画个草图,再拍张照片发送给GPT-4,并下达指令”按照这种布局做个网站”,系统便会迅速生成相应的网页代码。这一演示震惊了全球科技界,然而多模态功能此后却仿佛昙花一现,再未出现产品化的实际应用。如今,谷歌与OpenAI的多模态大战,终于拉开帷幕?

面对传闻中谷歌即将推出的这款”大杀器”,OpenAI显然不敢怠慢。据外媒The Information独家爆料,OpenAI正在紧锣密鼓研发一款代号为Gobi的新一代多模态大模型,计划在Gemini正式发布前抢占先机,以彻底击败谷歌。OpenAI的Greg Brockman与谷歌的Demis Hassabis,这两位AI领域的领军人物,正带领各自团队展开激烈角逐。

OpenAI在3月份推出GPT-4多模态功能后,已向Be My Eyes公司展示了这项技术,但尚未向其他企业开放。Be My Eyes公司专注于研发帮助视障人士改善视力的技术,这一合作显示出OpenAI对多模态应用场景的积极探索。近期,OpenAI计划更广泛地推出名为GPT-Vision的功能,但此前因担心视觉功能被不法分子利用(如自动破解验证码、追踪人类面部等)而有所延迟。不过,据称OpenAI的工程师们已解决了这些法律风险问题。谷歌方面同样重视安全防控,一位谷歌发言人表示,公司已采取措施防止Gemini被滥用,并承诺在所有产品中开发负责任的人工智能。

关于Gobi是否会成为传说中的GPT-5,目前尚无确切答案。与GPT-4不同,Gobi从一开始就是作为多模态模型设计的。DeepMind联合创始人、现Inflection AICEO Mustafa Suleyman在9月初的采访中透露,OpenAI正在秘密训练GPT-5,并暗示Sam Altman关于”没有训练GPT-5″的说法可能并不属实。尽管如此,Gobi的训练进度目前仍属保密。

另一方面,谷歌也在积极备战。据The Information报道,Gemini可能很快将进行测试发布,并集成到Google Cloud Vertex AI等服务中。在今年的谷歌I/O开发者大会上, Sundar Pichai曾详细介绍Gemini的多模态特性、高效集成工具和API功能。为了合力攻关,谷歌将谷歌大脑与DeepMind实验室合并,至少20位高管参与研发,包括DeepMind创始人Demis Hassabis和谷歌创始人Sergey Brin。DeepMind的数百名员工,包括前谷歌大脑主管Jeff Dean等顶尖人才,也加入了这一项目。

一位测试过Gemini的人士表示,该模型在理解用户意图方面比GPT-4更胜一筹,因为它不仅利用了公开网络信息,还整合了大量谷歌消费产品(搜索、YouTube)的专有数据。因此,Gemini产生的错误答案(即幻觉)似乎更少。据SemiAnalysis分析师爆料,Gemini已开始在算力高达~1e26 FLOPS的新TPUv5 Pod上进行训练,比GPT-4的训练算力高出5倍。其训练数据库包含YouTube上936亿分钟的视频字幕,总数据集规模约为GPT-4的两倍。据悉,谷歌下一代大模型可能采用MoE架构和投机采样技术,通过小模型提前生成token并传递给大模型进行评估,从而提高整体推理速度。

Gemini预计将花费数千万至数亿美元开发,与GPT-4的成本相当。DeepMind负责人Hassabis表示,Gemini将整合AlphaGo中使用的技术,将AlphaGo系统的规划、解决问题的能力与大语言模型的惊人语言能力相结合。此外,Gemini还将引入其他创新技术,包括DeepMind首创的强化学习技术。通过强化学习,AI能够通过反复尝试和接受反馈来调整自身表现,从而学会处理复杂问题。AlphaGo还使用了蒙特卡洛树搜索(MCTS)方法探索所有可能的棋盘动作,这些技术都将应用于Gemini的开发中。

谷歌希望Gemini能大幅提升软件开发人员的代码生成能力,以追赶微软的GitHub Copilot代码助手。内部讨论还涉及使用Gemini实现图表分析等功能,如解释图表含义、通过文本或语音指令浏览网页浏览器等。谷歌云开发者平台Google Cloud Vertex AI也将获得Gemini加持,支持大小版本,让开发人员可以在个人设备上运行付费购买的小模型。

在多模态模型竞赛中,OpenAI也不甘落后。7月,OpenAI宣布GPT-4 API全面可用,并计划在接下来几个月推出新模型。近日,许多用户收到了gpt-3.5-turbo-instruct新模型发布的邮件,替代了旧模型text-davinci-003。gpt-3.5-turbo-instruct是一款InstructGPT风格的模型,训练方式与text-davinci-003类似,采用提示词指令补全的方式使用。价格方面,gpt-3.5-turbo 4K保持与旧模型一致。有网友已开始使用最新模型进行国际象棋对弈,发现其表现令人惊叹。该模型轻松击败了Stockfish 4级(1700分),在5级(2000分)的比赛中仍保持强劲势头。它从不走非法棋步,善于使用开局牺牲,并展现出令人难以置信的卒与王将死技巧,允许对手毫无意义地晋级。网友使用PGN风格的提示模拟大师级游戏,发现纯Completion模型就取得了如此出色的表现。

值得一提的是,OpenAI即将在11月召开的首届开发者大会已经开始接受注册。这场多模态模型之争,不仅是技术实力的较量,更是AI发展方向的争夺。谷歌与OpenAI的这场AI版”iPhone与Android”对决,究竟谁将胜出?所有人都在屏息以待。

最新快讯

2026年02月11日

23:04
微新创想:2026年2月11日,美格智能技术股份有限公司正式通过香港交易所上市聆讯。这一重要进展标志着公司向国际化资本市场迈出了坚实一步。美格智能技术股份有限公司总部位于深圳,是一家专注于智能模组、AIoT解决方案以及无线通信技术研发的高科技企业。公司凭借在通信技术领域的深厚积累和持续创新,已成为行业内的领先者之一。 此次IPO计划募集的资金将主要用于多个关...
23:04
微新创想:2026年2月11日,字节跳动旗下AI助手豆包App在境内开启Seedance 2.0视频生成模型灰度测试 用户进入App内“AI创作”→“视频生成”模块后,部分被选中用户可见并可使用Seedance 2.0选项 此次灰度测试旨在验证新模型在生成质量、响应速度及多场景适配能力方面的升级效果 为全面上线积累数据与反馈 测试范围限于特定用户群体 未对外...
23:04
微新创想:2026年2月11日,浙江京新药业股份有限公司正式向香港交易所提交上市申请。公司注册地为浙江,主营业务涵盖化学药、中成药及医疗器械研发生产。本次IPO由中信证券独家保荐。此举旨在拓展国际融资渠道,支持创新药研发与全球化布局。申请尚待港交所审核,未披露拟募资规模及发行股份数量。
23:04
微新创想:据外媒消息,富士X-Pro 4旁轴风格APS-C画幅光电混合取景相机项目已重启,将在X-T6(预计2026年9月发布)之后推出,即最早于10月亮相。该机将改进X-Pro 3翻转屏排线易损问题,并有望搭载更高像素传感器。X-Pro 3发布于2019年10月,配备26.1MP X-Trans CMOS 4传感器,无机身防抖,国行首发价12790元,现已...
22:34
微新创想:2026年2月11日,影石创新在年度会议上宣布,其首款双持云台相机“Luna”将于2026年上半年正式发布。这一消息引起了广泛关注,标志着影石创新在高端手持影像设备领域迈出了新的一步。 该机由创始人兼CEO刘靖康主导研发,定位为非Pocket系列的差异化产品。不同于现有的Pocket系列,Luna将采用全新的设计理念,以满足不同用户对拍摄体验的更高...
22:34
微新创想:2026年1月,国家电网智慧车联网平台充电量达7.18亿千瓦时,同比增长9.71%。平台已接入可启停充电桩超111万个,注册用户逾6000万。 春节临近,江苏、浙江、安徽三省高速公路充电需求显著上升。长深、沈海、沪昆高速成为重点保障路段。为应对这一情况,国家电网已加大运维力度,确保充电设施稳定运行。 此外,国家电网还部署了应急设备,以应对可能出现的...
22:34
微新创想:2026年2月11日 理想汽车宣布其自建超充网络正式突破4000座 超充桩超22000根 覆盖全国31个省份、289座城市 其中高速超充站超1200座 实现“九纵九横”18条国家级高速贯通 平均130公里一座 5C超充桩达4500根以上 500余站全系配备 城市端支持VLA自动泊入充电车位及开盖功能 提升补能效率 该网络被官方称为当前车企最大规模自...
22:34
微新创想 2月11日的消息显示,这个春节全网都在期待DeepSeek发布最新的大模型DeepSeek V4。然而,从目前的情况来看,大版本的发布可能不会在春节期间进行。今天DeepSeek悄然更新了一个新版本,带来了不少亮点。根据DeepSeek官方的介绍,这次更新主要集中在提升模型的上下文处理能力,达到了1M的长度,而此前的DeepSeek V3系列仅支持...
22:34
微新创想:春节返乡潮来临 理想汽车补能网络再创新高 理想汽车近日宣布其超充站数量正式突破4000座 超充桩数量超过22000根 这标志着理想汽车在充电基础设施建设方面取得了重要进展 建成了车企中最大规模的自建超充网络 为用户提供了更加便捷高效的补能体验 全国范围内 4000座超充站已覆盖31个省份 289座城市 其中高速超充站数量已超过1200座 实现了九纵...
22:33
微新创想:春节期间聚会难免小酌几杯但若是同桌人喝酒喝出问题同桌的人需要负责吗 荆州市沙市区人民法院审理了这样一起典型案例 据介绍2025年2春节期间龙某在朋友朱某某陪同下前往杨某某家中拜年并参与家庭聚餐 席间杨某某询问就餐人员是否饮酒龙某与杨某德均表示可小酌一杯杨某某遂为龙某倒了约1两散装白酒为杨某德倒了约2两散装白酒其余聚餐人员均未饮酒也无劝酒行为 餐后杨...
22:33
微新创想 京东今日正式宣布入局AI支付领域 推出京东AI付 用户凭借语音即可便捷 安全支付 据悉 该功能搭载京东JoyAI大模型能力 适用于AI助手 智能终端等多种软硬件载体 用户通过简单的语音指令即可完成支付全流程 例如在支付过程中直接语音切换绑定的银行卡 目前 该功能已率先在京东的JoyAI App及其智能眼镜JoyGlance等终端设备上投入使...
22:00
微新创想:2026年2月12日,《人中之龙 极3/外传 Dark Ties》将登陆PS5、Xbox Series X|S、Switch 2及PC平台 本作由世嘉发行,国区标准版售价268元,豪华版338元,包含多套限定装扮与BGM道具 媒体评分解禁,PS5版Metacritic均分75分(43家),PC版73分(16家);IGN给出7分,肯定其战斗系统重制与...