Gemini 3 Pro深度评测:AI新巅峰,代码能力惊艳全场

Gemini 3 Pro深度评测:AI新巅峰,代码能力惊艳全场插图1

等了很久、很久、很久。也期待了很久、很久、很久的Gemini3Pro,终于在昨天晚上,正式上线了。此前关于这款大模型的传闻屡见不鲜,但每次都被证明是误传。尤其是大模型竞技场中的lithiumflow和orionmist,曾被广泛猜测为Gemini3Pro,网络上充斥着各种酷炫的SVG图示,声称展示了该模型的性能水平。然而从9月到10月,再到11月过半,这两款模型逐渐淡出公众视野。随后,名为riftrunner的Gemini3候选模型出现,再次被网友称为Gemini3,让无数人的心绪始终处于躁动不安之中。

Gemini 3 Pro深度评测:AI新巅峰,代码能力惊艳全场插图2

讲真,我曾在无数场合盛赞曾经的Gemini2.5Pro,它是最有人味、文笔最棒、创意最佳的大模型。尽管近期GPT5.1-Thinking在人文表现上略有超越,但我依然钟爱它。如今,相隔238天,Gemini3Pro终于问世。经过实测,可以说这是2025年最强大的模型。即便我已对其抱有极高期待,Google的表现依然令人惊叹。目前,在所有主要Arena排行榜中,Gemini3Pro几乎独占鳌头,堪称AI领域的王者。

Gemini 3 Pro深度评测:AI新巅峰,代码能力惊艳全场插图3

现在,Gemini3Pro已可在AI Studio中使用,网址为https://aistudio.google.com/。Google Gemini网页版也已上线。说实话,Gemini3pro的跑分表现令人震撼,几乎所有指标均遥遥领先,唯有软件工程能力稍逊于GPT-5.1和CLaude Sonnet4.5,其他方面堪称断层式领先。第一眼看到这张表格数据时,我甚至怀疑自己是否因熬夜过度导致视力下降。在著名的Humanity’s Last Exam评测集上,Gemini2.5Pro得分为21.6%,Claude Sonnet4.5为13.7%,GPT-5.1为26.5%,而Gemini3Pro则达到37.5%,开启工具使用后更攀升至45.8%。但这还不是最惊人的部分。

Gemini 3 Pro深度评测:AI新巅峰,代码能力惊艳全场插图4

在MathArena Apex这个堪称超难奥赛压轴题专场的评测中,GPT-5.1仅得1分,Claude Sonnet4.5得1.6分,Gemini2.5Pro得0.5分,而Gemini3Pro却拿到23.4分。当时我简直不敢相信自己的眼睛,这个结果真的如此离谱。这就像小学生还在掰手指头算加减法,而旁边的Gemini3已经开始用微积分徒手设计火箭了。在ScreenSpot-Pro这个专门折磨多模态模型的GUI Grounding评测集上,GPT-5.1仅得3.5%,Claude Sonnet4.5得36.2%,Gemini3Pro却达到72.7%。Gemini3Pro在电脑操作方面展现出毁灭级实力,能精准识别屏幕上的每个按钮、图标和文字,未来将成为AI操作电脑的终极神器。

Gemini 3 Pro深度评测:AI新巅峰,代码能力惊艳全场插图5

然而,这些成就都无法体现Gemini3Pro最令人惊叹的能力——前端代码能力。直接用一句话描述需求,Gemini3Pro就能迅速生成完整代码。比如设计一个体素艺术场景,十几秒内就能完成。虽然奶龙的设计略显抽象,但交互效果极为流畅。随手开发台球游戏,双人对局和真实物理引擎令人震惊,仅凭一句话描述,完成度却远超预期。前端开发案例同样令人赞叹,无论是模拟黑胶唱片的音乐播放器,还是支持绘制、撤销、导出GIF的像素画板,Gemini3Pro都能轻松应对。

Gemini 3 Pro深度评测:AI新巅峰,代码能力惊艳全场插图6

更令人惊叹的是图转代码的复刻能力。上传网页截图并指定样式,二十几秒后就能生成完整前端网页。虽然部分细节(如字体)有所调整,但整体布局和样式已相当出色。我曾与众多前端开发者合作,能做出这种水平的代码,他们往往需要反复调试。另一个案例是复刻可编辑的前端界面,只需简单描述,Gemini3Pro就能实现复杂功能。最离谱的是我随口提出的Windows风格Web OS项目,近两分钟生成的代码块中,大部分功能(包括可玩的终端和游戏)竟然全部实现!

Gemini 3 Pro深度评测:AI新巅峰,代码能力惊艳全场插图7

Gemini3Pro的能力令人瞠目结舌,连奥特曼都罕见现身为Google庆祝。我们这一代人或许站在了AI时代的全新起点。从此,前端开发可能不再那么重要,框架调优也变得次要,关键在于能否清晰、具体、生动地描述需求,将脑海中的创意转化为明确指令。品味和表达能力将成为核心竞争力。当我们一边吐槽、一边兴奋、一边测试demo时,未来已悄然来临。238天的等待终值,所有不安和质疑都化为最好的见证。Google依然是AI领域的王者,让我们开始创造吧。

Gemini 3 Pro深度评测:AI新巅峰,代码能力惊艳全场插图8

Gemini 3 Pro深度评测:AI新巅峰,代码能力惊艳全场插图9

Gemini 3 Pro深度评测:AI新巅峰,代码能力惊艳全场插图10

Gemini 3 Pro深度评测:AI新巅峰,代码能力惊艳全场插图11

Gemini 3 Pro深度评测:AI新巅峰,代码能力惊艳全场插图12

Gemini 3 Pro深度评测:AI新巅峰,代码能力惊艳全场插图13

Gemini 3 Pro深度评测:AI新巅峰,代码能力惊艳全场插图14

最新快讯

2025年11月19日

11:12
11月18日,全球知名娱乐巨头华特迪士尼公司在中国上海盛大举办《疯狂动物城2》全球庆典活动。这场盛大的发布会选址于上海迪士尼度假区的核心区域——"疯狂动物城"主题园区内,旨在为影迷们呈现一场充满动物世界魅力的视听盛宴。 活动现场星光熠熠,原班英文配音阵容中的金妮弗·古德温率先亮相红毯,与刚刚加入的新成员关继威共同出席。在中文配音方面,实力派配音演员季冠霖与张...
11:12
2025年11月19日,领先的创作者内容广告平台Agentio正式宣布成功斩获4000万美元B轮融资,标志着其快速发展迈入新阶段。本轮融资由知名风险投资机构先锋资本(Forerunner)强势领投,同时吸引了Benchmark、Craft Ventures、AlleyCorp、Antler及Starting Line等多家现有投资方积极跟投。随着此次融资的圆...
11:12
2025年11月19日,美团旅行最新发布的数据揭示了一股强劲的冰雪旅游热潮正在席卷中国北方。数据显示,受大风降温天气影响,自11月第二周起,“崇礼滑雪”相关关键词搜索量同比激增169%,这一显著增长清晰地反映出消费者对冬季冰雪运动的热情高涨。受此趋势带动,张家口市在11月下旬的文化旅游预订量也呈现爆发式增长,整体增速同比提升25%,展现出强大的市场活力。 在...
11:12
2025年11月14日,教育部正式公示了7所顶尖高校申请增设“具身智能”本科专业的消息,包括北京航空航天大学、北京理工大学、北京邮电大学、东北大学、上海交通大学、浙江大学以及西安交通大学。这一全新专业属于工学门类,是首次未被列入官方专业目录的创新性学科,彰显了我国在高等教育领域的改革决心与前瞻布局。 此次增设“具身智能”专业,是响应国家培育未来战略性产业的重...
11:12
11月17日,游戏行业领军企业Take-Two首席执行官施特劳斯・泽尔尼克在CNBC的采访中,为行业发展趋势提供了深刻洞见。他明确指出,当前游戏产业正经历一场从传统主机向PC平台及开放生态系统的重大转型。这一变革的核心在于商业模式的演变——尽管主机依然能提供高品质的沉浸式体验,但整个行业的营收重心已逐渐转向开放化平台。 施特劳尼克特别强调,传统主机市场已陷入...
11:12
2025年11月19日,绍兴木棉花酒店携手素画廊隆重推出年度艺术盛事——双个展《风与光的栖居》。此次展览由著名策展人陈素婷精心策划,特邀中央美术学院背景的实力派画家张子欣与国际雕塑大奖得主陈松林联袂呈现,以艺术之笔描绘自然与人文的对话。 张子欣以细腻的布面油画语言,将自然诗意转化为视觉诗篇。她通过独特的色彩运用与构图技巧,捕捉光影在自然中的微妙变化,让观...
11:12
2025年11月19日,生鲜电商领军企业叮咚买菜重磅发布“真安心鱼”水产安全体系,标志着平台在食品安全领域迈出里程碑式进展。这一体系由叮咚买菜首席商品官徐志坚亲自揭晓,其核心目标在于构建水产安全的可管理、可验证与可信任三大支柱,为消费者提供真正放心的水产品。 “真安心鱼”体系依托三大核心方法论,打造全方位的水产安全保障网络。首先通过“求真溯源”技术,实现从养...
11:12
2025年10月,随着国家正式发布“十五五”规划建议,明确提出要推动房地产产业向高质量发展转型,整个行业格局正迎来深刻变革。银河证券最新研报显示,受去年销售基数偏高以及行业筑底期的影响,今年房地产销售与投资两端均面临同比下滑压力,其中开工和竣工面积降幅较前期进一步扩大。值得注意的是,在当前市场环境下,头部房企凭借其卓越的运营管理能力和雄厚的资金实力,展现出明...
11:12
2025年11月17日,备受瞩目的阿里旗下千问App正式开启公测,其表现力惊人,当日便在iOS免费应用榜单中强势攀升至第6位,彰显出强大的市场吸引力。据中信建投深度分析,阿里巴巴在人工智能领域的布局此前主要集中在B端大模型与云服务领域,其通义系列衍生模型数量已突破17万个,稳居全球首位,展现了阿里在AI技术研发上的雄厚实力。此次千问App的推出,标志着阿里巴...
11:12
华为终端正式官宣,旗下首款搭载鸿蒙系统的二合一平板——MatePad Edge将于11月25日震撼登场。这款创新产品凭借其独特的一体化设计理念,巧妙融合了平板、支架与键盘三大核心功能,实现了平板与电脑模式的无缝切换,为用户带来前所未有的移动办公体验。其设计既兼顾了极致的便携性,又充分提升了生产力表现,堪称移动办公领域的全能选手。此次新品发布,标志着华为鸿蒙生...
11:12
2025年11月19日,乐摩物联正式向香港交易所递交了上市聆讯相关资料。这家专注于智能健康科技的企业,凭借其创新性的物联网应用,成功打造了都市人群专属的舒压体验空间。旗下核心品牌“乐摩吧”以科技赋能传统按摩服务,将健康养生、休闲放松与娱乐互动完美融合,为现代都市人构建了一个智能化的健康生活服务平台。此次冲刺港交所的资本市场,不仅彰显了乐摩物联在智能按摩领域的...
11:12
2025年,备受瞩目的《拉美50佳餐厅》正式揭晓第51至100名的扩展榜单,进一步展现了拉丁美洲餐饮世界的蓬勃活力与无限可能。此次新增的13家卓越餐厅分别来自11座充满魅力的城市,其中包括秘鲁首都利马、巴西经济中心圣保罗以及墨西哥城等美食重镇。秘鲁利马的Shizen餐厅在首次参评中便以卓越表现位列全球第62位,彰显了南美美食的独特魅力。巴西圣保罗凭借其丰富的...