随着秋意渐浓,人工智能领域正掀起一场激烈的多模态模型之争。谷歌与OpenAI两大巨头在这场技术较量中展开了白热化竞争。就在不久前,谷歌向部分外部企业开放了其多模态大模型Gemini的试用权限。面对谷歌的强势出击,OpenAI显然不会甘居人后,正全力以赴将多模态功能整合进GPT-4,力求推出与Gemini媲美的多模态大模型,一举在AI领域占据制高点。

多模态技术的震撼亮相,可追溯至今年3月OpenAI的GPT-4发布会。当时,Greg Brockman亲自演示了这一神奇功能:只需在纸上画个草图,再拍张照片发送给GPT-4,并下达指令”按照这种布局做个网站”,系统便会迅速生成相应的网页代码。这一演示震惊了全球科技界,然而多模态功能此后却仿佛昙花一现,再未出现产品化的实际应用。如今,谷歌与OpenAI的多模态大战,终于拉开帷幕?

面对传闻中谷歌即将推出的这款”大杀器”,OpenAI显然不敢怠慢。据外媒The Information独家爆料,OpenAI正在紧锣密鼓研发一款代号为Gobi的新一代多模态大模型,计划在Gemini正式发布前抢占先机,以彻底击败谷歌。OpenAI的Greg Brockman与谷歌的Demis Hassabis,这两位AI领域的领军人物,正带领各自团队展开激烈角逐。

OpenAI在3月份推出GPT-4多模态功能后,已向Be My Eyes公司展示了这项技术,但尚未向其他企业开放。Be My Eyes公司专注于研发帮助视障人士改善视力的技术,这一合作显示出OpenAI对多模态应用场景的积极探索。近期,OpenAI计划更广泛地推出名为GPT-Vision的功能,但此前因担心视觉功能被不法分子利用(如自动破解验证码、追踪人类面部等)而有所延迟。不过,据称OpenAI的工程师们已解决了这些法律风险问题。谷歌方面同样重视安全防控,一位谷歌发言人表示,公司已采取措施防止Gemini被滥用,并承诺在所有产品中开发负责任的人工智能。

关于Gobi是否会成为传说中的GPT-5,目前尚无确切答案。与GPT-4不同,Gobi从一开始就是作为多模态模型设计的。DeepMind联合创始人、现Inflection AICEO Mustafa Suleyman在9月初的采访中透露,OpenAI正在秘密训练GPT-5,并暗示Sam Altman关于”没有训练GPT-5″的说法可能并不属实。尽管如此,Gobi的训练进度目前仍属保密。

另一方面,谷歌也在积极备战。据The Information报道,Gemini可能很快将进行测试发布,并集成到Google Cloud Vertex AI等服务中。在今年的谷歌I/O开发者大会上, Sundar Pichai曾详细介绍Gemini的多模态特性、高效集成工具和API功能。为了合力攻关,谷歌将谷歌大脑与DeepMind实验室合并,至少20位高管参与研发,包括DeepMind创始人Demis Hassabis和谷歌创始人Sergey Brin。DeepMind的数百名员工,包括前谷歌大脑主管Jeff Dean等顶尖人才,也加入了这一项目。

一位测试过Gemini的人士表示,该模型在理解用户意图方面比GPT-4更胜一筹,因为它不仅利用了公开网络信息,还整合了大量谷歌消费产品(搜索、YouTube)的专有数据。因此,Gemini产生的错误答案(即幻觉)似乎更少。据SemiAnalysis分析师爆料,Gemini已开始在算力高达~1e26 FLOPS的新TPUv5 Pod上进行训练,比GPT-4的训练算力高出5倍。其训练数据库包含YouTube上936亿分钟的视频字幕,总数据集规模约为GPT-4的两倍。据悉,谷歌下一代大模型可能采用MoE架构和投机采样技术,通过小模型提前生成token并传递给大模型进行评估,从而提高整体推理速度。

Gemini预计将花费数千万至数亿美元开发,与GPT-4的成本相当。DeepMind负责人Hassabis表示,Gemini将整合AlphaGo中使用的技术,将AlphaGo系统的规划、解决问题的能力与大语言模型的惊人语言能力相结合。此外,Gemini还将引入其他创新技术,包括DeepMind首创的强化学习技术。通过强化学习,AI能够通过反复尝试和接受反馈来调整自身表现,从而学会处理复杂问题。AlphaGo还使用了蒙特卡洛树搜索(MCTS)方法探索所有可能的棋盘动作,这些技术都将应用于Gemini的开发中。

谷歌希望Gemini能大幅提升软件开发人员的代码生成能力,以追赶微软的GitHub Copilot代码助手。内部讨论还涉及使用Gemini实现图表分析等功能,如解释图表含义、通过文本或语音指令浏览网页浏览器等。谷歌云开发者平台Google Cloud Vertex AI也将获得Gemini加持,支持大小版本,让开发人员可以在个人设备上运行付费购买的小模型。

在多模态模型竞赛中,OpenAI也不甘落后。7月,OpenAI宣布GPT-4 API全面可用,并计划在接下来几个月推出新模型。近日,许多用户收到了gpt-3.5-turbo-instruct新模型发布的邮件,替代了旧模型text-davinci-003。gpt-3.5-turbo-instruct是一款InstructGPT风格的模型,训练方式与text-davinci-003类似,采用提示词指令补全的方式使用。价格方面,gpt-3.5-turbo 4K保持与旧模型一致。有网友已开始使用最新模型进行国际象棋对弈,发现其表现令人惊叹。该模型轻松击败了Stockfish 4级(1700分),在5级(2000分)的比赛中仍保持强劲势头。它从不走非法棋步,善于使用开局牺牲,并展现出令人难以置信的卒与王将死技巧,允许对手毫无意义地晋级。网友使用PGN风格的提示模拟大师级游戏,发现纯Completion模型就取得了如此出色的表现。

值得一提的是,OpenAI即将在11月召开的首届开发者大会已经开始接受注册。这场多模态模型之争,不仅是技术实力的较量,更是AI发展方向的争夺。谷歌与OpenAI的这场AI版”iPhone与Android”对决,究竟谁将胜出?所有人都在屏息以待。

最新快讯

2025年10月29日

09:34
上个月,朋友老张急匆匆找到我:"网站流量又掉了15%,SEO团队说排名没问题啊,到底怎么回事?"我问他:"你查过AI平台推荐你的品牌吗?"他一脸懵:"AI还会推荐品牌?"说实话,这场景我见太多次了。很多企业主还在盯着Google排名,却没意识到用户已经转向AI搜索了。根据Superlines2025年的报告,71%的美国人已经在用AI搜索研究购买或评估品牌。...
09:34
配件品牌Spigen近期震撼发布全新Zero:One系列,专为iPhone 17打造,凭借其颠覆性的“拆解风格”设计迅速引爆市场。该系列核心产品Ultra Hybrid Zero:One手机壳采用创新工艺,通过高精度全息印刷技术,将手机内部精密元件的布局以逼真效果呈现背板,让用户在欣赏外观的同时仿佛能“透视”核心结构,完美融合前沿科技与视觉艺术。 这款手机壳...
09:34
微软首席执行官萨提亚·纳德拉近期发表重要观点,指出当前游戏行业的竞争焦点并非来自其他游戏平台,而是来自TikTok等短视频应用的巨大挑战。这一观点在业界引发广泛关注,凸显了新兴媒体平台对传统游戏市场的深刻影响。 在接受媒体采访时,纳德拉特别强调Windows作为微软核心游戏业务平台的战略地位。他指出Steam这一全球知名游戏生态正是建立在Windows基础之...
09:34
微软与OpenAI近日正式宣布达成重组协议,这一举措标志着全球领先的ChatGPT制造商正加速迈向商业化转型之路。OpenAI首席执行官萨姆・奥尔特曼在一场备受瞩目的直播中明确表示,鉴于训练尖端AI系统所需的高昂资金投入,首次公开募股(IPO)已成为公司未来最具可行性的发展路径。此次战略调整不仅将推动OpenAI从传统的产品驱动模式转向平台化运营,更将向全球...
09:34
2025年10月27日,医学界迎来重大突破性进展。美国男子蒂姆·安德鲁斯在接受基因编辑猪肾脏移植后,成功存活了271天,这一成就不仅刷新了当前异种器官移植的存活纪录,更标志着人类在器官移植领域迈出了革命性的一步。据悉,用于移植的猪肾脏原本因功能衰竭已被摘除,但在被用于安德鲁斯之前,它以非凡的“余热”帮助维持了患者的基本生命体征,期间未出现任何严重的排斥反应。...
09:34
截至2025年10月29日,农业农村部最新农情调度数据显示,全国秋粮收获工作已取得显著进展,整体进度已超过八成半。这一阶段性成果的取得,充分展现了我国农业生产的强大韧性和高效水平。 在各大产区中,东北主产区表现尤为突出,秋粮收获进度已超过九成,成为全国秋粮收获的先行者。西北地区紧随其后,收获进度接近九成,为全国秋粮稳产增产奠定了坚实基础。西南地区和黄淮海地区...
09:34
2025年10月29日,协创数据通过官方互动平台正式宣布,已与全球知名存储品牌闪迪(SanDisk)达成深度战略合作关系。此次合作覆盖多个核心产品线,标志着双方在存储设备领域将展开全方位协同,共同提升市场竞争力。协创数据表示,虽然具体合作细节暂未对外披露,但相关项目已进入实质性推进阶段,并预计将取得显著成果。此次合作不仅有助于协创数据在消费电子及存储解决方案...
09:34
10月27日,安徽实华工程技术股份有限公司(简称"实华股份")正式发布第七期IPO辅导进展报告,宣布正式启动登陆北京证券交易所的征程,其辅导机构由湘财证券独家负责。据悉,实华股份自2023年12月完成辅导备案以来,已稳步推进各项准备工作,本期辅导期预计将持续至2025年9月30日。 作为一家具有深厚行业积淀的企业,实华股份的前身可追溯至安庆石化设计院,长期专...
09:34
中信建投最新行业洞察显示,多家医疗器械细分领域的龙头企业有望在2026年迎来加速增长期。这一前瞻性预测主要基于第三季度已披露的业绩数据以及行业整体复苏的积极趋势。短期内,机构建议投资者重点关注2026年业绩有望改善的标的,把握估值修复带来的投资机会。随着即将到来的第四季度流感季,呼吸道检测需求预计将显著上升,叠加"双11"期间家用医疗器械线上销售的高峰期,相...
09:34
近日,备受家长信赖的儿童教育品牌宝宝巴士旗下“宝宝巴士儿歌”App突然陷入舆论漩涡,因开屏广告出现低俗擦边内容引发社会广泛关注和强烈担忧。据多位家长反映,该App在非会员状态下弹出的第三方广告中,存在明显不适宜儿童观看的擦边画面,不仅严重违背了儿童内容安全的基本原则,更让众多家长对品牌的专业性和责任感产生质疑。 面对此次危机,宝宝巴士品牌客服迅速作出回应。客...
09:34
科技媒体MacRumors于10月28日独家爆料,苹果正在秘密研发新一代iPad mini,这款备受期待的设备或将带来颠覆性的变革——首次配备专业级防水功能,预计最早将于2026年正式亮相。值得注意的是,目前市面上销售的iPad mini并不具备任何官方防水认证,苹果官方甚至明确建议用户避免在潮湿环境中使用,这一限制在新机型上有望得到彻底突破。 为实现卓越的...
09:34
10月29日,全球领先的半导体存储器制造商SK海力士正式发布市场预测,指出高带宽存储器(HBM)的增长速度将显著超越传统DRAM,成为未来存储市场的主导力量。根据公司最新报告,预计到2027年,HBM的供应将持续保持紧张态势。这一趋势的背后,是人工智能技术的爆发式增长对高带宽存储器需求的强劲拉动。作为存储器市场的领军企业,SK海力士正积极调整战略,大幅增加H...