随着秋意渐浓,人工智能领域正掀起一场激烈的多模态模型之争。谷歌与OpenAI两大巨头在这场技术较量中展开了白热化竞争。就在不久前,谷歌向部分外部企业开放了其多模态大模型Gemini的试用权限。面对谷歌的强势出击,OpenAI显然不会甘居人后,正全力以赴将多模态功能整合进GPT-4,力求推出与Gemini媲美的多模态大模型,一举在AI领域占据制高点。

多模态技术的震撼亮相,可追溯至今年3月OpenAI的GPT-4发布会。当时,Greg Brockman亲自演示了这一神奇功能:只需在纸上画个草图,再拍张照片发送给GPT-4,并下达指令”按照这种布局做个网站”,系统便会迅速生成相应的网页代码。这一演示震惊了全球科技界,然而多模态功能此后却仿佛昙花一现,再未出现产品化的实际应用。如今,谷歌与OpenAI的多模态大战,终于拉开帷幕?

面对传闻中谷歌即将推出的这款”大杀器”,OpenAI显然不敢怠慢。据外媒The Information独家爆料,OpenAI正在紧锣密鼓研发一款代号为Gobi的新一代多模态大模型,计划在Gemini正式发布前抢占先机,以彻底击败谷歌。OpenAI的Greg Brockman与谷歌的Demis Hassabis,这两位AI领域的领军人物,正带领各自团队展开激烈角逐。

OpenAI在3月份推出GPT-4多模态功能后,已向Be My Eyes公司展示了这项技术,但尚未向其他企业开放。Be My Eyes公司专注于研发帮助视障人士改善视力的技术,这一合作显示出OpenAI对多模态应用场景的积极探索。近期,OpenAI计划更广泛地推出名为GPT-Vision的功能,但此前因担心视觉功能被不法分子利用(如自动破解验证码、追踪人类面部等)而有所延迟。不过,据称OpenAI的工程师们已解决了这些法律风险问题。谷歌方面同样重视安全防控,一位谷歌发言人表示,公司已采取措施防止Gemini被滥用,并承诺在所有产品中开发负责任的人工智能。

关于Gobi是否会成为传说中的GPT-5,目前尚无确切答案。与GPT-4不同,Gobi从一开始就是作为多模态模型设计的。DeepMind联合创始人、现Inflection AICEO Mustafa Suleyman在9月初的采访中透露,OpenAI正在秘密训练GPT-5,并暗示Sam Altman关于”没有训练GPT-5″的说法可能并不属实。尽管如此,Gobi的训练进度目前仍属保密。

另一方面,谷歌也在积极备战。据The Information报道,Gemini可能很快将进行测试发布,并集成到Google Cloud Vertex AI等服务中。在今年的谷歌I/O开发者大会上, Sundar Pichai曾详细介绍Gemini的多模态特性、高效集成工具和API功能。为了合力攻关,谷歌将谷歌大脑与DeepMind实验室合并,至少20位高管参与研发,包括DeepMind创始人Demis Hassabis和谷歌创始人Sergey Brin。DeepMind的数百名员工,包括前谷歌大脑主管Jeff Dean等顶尖人才,也加入了这一项目。

一位测试过Gemini的人士表示,该模型在理解用户意图方面比GPT-4更胜一筹,因为它不仅利用了公开网络信息,还整合了大量谷歌消费产品(搜索、YouTube)的专有数据。因此,Gemini产生的错误答案(即幻觉)似乎更少。据SemiAnalysis分析师爆料,Gemini已开始在算力高达~1e26 FLOPS的新TPUv5 Pod上进行训练,比GPT-4的训练算力高出5倍。其训练数据库包含YouTube上936亿分钟的视频字幕,总数据集规模约为GPT-4的两倍。据悉,谷歌下一代大模型可能采用MoE架构和投机采样技术,通过小模型提前生成token并传递给大模型进行评估,从而提高整体推理速度。

Gemini预计将花费数千万至数亿美元开发,与GPT-4的成本相当。DeepMind负责人Hassabis表示,Gemini将整合AlphaGo中使用的技术,将AlphaGo系统的规划、解决问题的能力与大语言模型的惊人语言能力相结合。此外,Gemini还将引入其他创新技术,包括DeepMind首创的强化学习技术。通过强化学习,AI能够通过反复尝试和接受反馈来调整自身表现,从而学会处理复杂问题。AlphaGo还使用了蒙特卡洛树搜索(MCTS)方法探索所有可能的棋盘动作,这些技术都将应用于Gemini的开发中。

谷歌希望Gemini能大幅提升软件开发人员的代码生成能力,以追赶微软的GitHub Copilot代码助手。内部讨论还涉及使用Gemini实现图表分析等功能,如解释图表含义、通过文本或语音指令浏览网页浏览器等。谷歌云开发者平台Google Cloud Vertex AI也将获得Gemini加持,支持大小版本,让开发人员可以在个人设备上运行付费购买的小模型。

在多模态模型竞赛中,OpenAI也不甘落后。7月,OpenAI宣布GPT-4 API全面可用,并计划在接下来几个月推出新模型。近日,许多用户收到了gpt-3.5-turbo-instruct新模型发布的邮件,替代了旧模型text-davinci-003。gpt-3.5-turbo-instruct是一款InstructGPT风格的模型,训练方式与text-davinci-003类似,采用提示词指令补全的方式使用。价格方面,gpt-3.5-turbo 4K保持与旧模型一致。有网友已开始使用最新模型进行国际象棋对弈,发现其表现令人惊叹。该模型轻松击败了Stockfish 4级(1700分),在5级(2000分)的比赛中仍保持强劲势头。它从不走非法棋步,善于使用开局牺牲,并展现出令人难以置信的卒与王将死技巧,允许对手毫无意义地晋级。网友使用PGN风格的提示模拟大师级游戏,发现纯Completion模型就取得了如此出色的表现。

值得一提的是,OpenAI即将在11月召开的首届开发者大会已经开始接受注册。这场多模态模型之争,不仅是技术实力的较量,更是AI发展方向的争夺。谷歌与OpenAI的这场AI版”iPhone与Android”对决,究竟谁将胜出?所有人都在屏息以待。

最新快讯

2025年10月29日

19:47
2025年10月29日,中国领先的智能制造解决方案提供商金道科技正式宣布与杭叉集团达成战略合作,双方将携手开启人形机器人关节模组等精密传动部件的研发制造新篇章。此次战略携手标志着两大行业巨头的深度协同,通过整合各自在精密制造与机器人领域的核心优势,共同打造下一代智能机器人关键部件的领先技术方案。 此次合作的核心目标在于突破人形机器人核心技术瓶颈,金道科技...
19:47
2025年第三季度,獐子岛业绩表现不尽如人意,净利润出现显著亏损,达到4252.26万元。同期公司实现营业收入3.11亿元,较去年同期下降19.92%,显示出明显的下滑趋势。从全年来看,前三季度累计营收为10.83亿元,虽然较去年同期仅下降7.14%,但净亏损却达到3237.34万元,反映出公司整体盈利能力面临挑战。 造成这一业绩下滑的主要原因,是外部市...
19:47
2025年前三季度,海信视像交出亮眼业绩单,净利润高达16.29亿元,同比增长24.27%,展现出强劲的增长势头。公司整体营业收入达到428.3亿元,同比增长5.36%(调整后),进一步巩固了市场领先地位。其中,第三季度表现尤为突出,营收达到156亿元,同比增长2.7%;净利润更是攀升至5.73亿元,同比增长20.15%,显示出公司持续稳健的经营能力。 这一...
19:47
2025年10月29日,恒润股份正式发布重要公告,宣布其控股子公司上海润六尺科技有限公司将在深圳启动一项重大战略投资,计划设立全资子公司——深圳润六尺科技有限公司。据悉,新公司注册资本高达1亿元人民币,注册地选定在中国科技创新之都深圳,核心业务将聚焦于算力技术的研发与应用。此次布局是恒润股份在算力技术领域迈出的关键一步,旨在进一步拓展业务版图,增强公司在该领...
19:47
2025年10月29日,中国领先的锂电池材料供应商当升科技与江苏金坛经济开发区管委会正式达成战略合作,签署固态电解质材料产业化项目投资合作协议。这一具有里程碑意义的合作标志着当升科技在新能源材料领域的布局再进一步,为推动中国固态锂电池产业发展注入强劲动力。 项目将由当升科技全资子公司当升科技(常州)新材料有限公司全面负责实施,项目选址位于常州市金坛区现代化工...
19:17
2025年第三季度,中航沈飞交出亮眼业绩单,净利润高达2.25亿元,同比增长12.89%,展现出强劲的增长势头。同期公司营收达到59.78亿元,同比增长62.77%,营收规模再创新高。从全年来看,前三季度累计营收206.07亿元,虽然同比下降18.54%,但净利润仍达到13.62亿元,同比下降25.10%。业绩波动主要受交付节奏变化及成本结构调整双重因素影响...
19:17
2025年前三季度,分众传媒交出亮眼业绩单,净利润高达42.40亿元,同比增长6.87%,展现出稳健的增长态势。同期营收表现同样亮眼,达到96.07亿元,同比增长3.73%,彰显出公司强大的市场竞争力。特别值得注意的是第三季度的表现,营收与净利润均实现双增长,分别为34.94亿元和15.76亿元,同比增长率分别为6.08%和6.85%,进一步印证了公司业务持...
19:17
2025年10月29日,金帝股份正式发布关于拟发行可转债的重要公告,计划通过此次融资募集不超过10亿元人民币的资金。这笔资金将重点投向两大核心项目:一是高端装备关键零部件智能制造项目,二是关节模组精密零部件及半导体散热片智能制造项目。同时,部分资金也将用于补充公司日常运营的流动资金。此次募资计划的推出,充分体现了公司对战略发展的长远规划,其根本目的在于显著提...
19:17
续作将激扬首季高潮,草帽一伙从罗格镇扬帆起航,穿越神秘颠倒山正式踏入伟大航路,沿途将依次经历小花园、磁鼓王国、阿拉巴斯坦等令人印象深刻的经典场景。这一段充满未知的冒险旅程,不仅延续了原作的魅力,更将为观众带来全新的视觉盛宴。 与此同时,东映动画正式宣布为配合备受期待的"艾尔巴夫篇"制作升级,原定于2026年1月至3月将暂停播出。这一调整旨在为动画团队提供更充...
19:17
2025年10月29日,老板电器正式发布其第三季度财务报告,数据显示公司在该季度实现营收27.04亿元,同比增长1.42%,展现出稳健的增长态势;净利润方面则达到4.46亿元,同比增长0.65%,虽增速相对放缓,但仍保持积极态势。从全年来看,前三季度累计营收73.12亿元,较去年同期下降1.14%,净利润11.57亿元,同比下降3.73%,整体业绩呈现一定压...
19:17
央视新闻报道了一起令人震惊的特大网络诈骗案,涉案团伙以“风水大师”为幌子,精心策划了一场针对中老年人的骗局。他们通过免费直播课程作为诱饵,吸引大量中老年群体参与,随后以高价收费课程和“督导师兄”陪伴为名,一步步诱导受害者深陷其中。更令人发指的是,该团伙还编造虚构的家人遭遇血光之灾等恐怖情节,对受害者进行心理操控,使其无法自拔。 在这起诈骗案中,“二阶”诈骗团...
19:17
2025年第三季度,大有能源财务状况出现显著波动,实现净亏损2.7亿元。这一季度表现进一步拉长了公司全年的亏损轨迹,前三季度累计净亏损已达11.22亿元,较去年同期实现了惊人的由盈转亏。这一业绩下滑背后,主要受两大因素影响:一是煤炭市场价格持续下行,导致公司主营业务收入大幅缩水;二是资产减值计提大幅增加,反映出公司对部分资产未来盈利能力的担忧。面对严峻的经营...