最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年03月19日

12:25
微新创想:大模型赛道正从“卷参数”转向“卷应用”,而阿里巴巴已经亮出了其下半场的最强底牌。3 月 16 日,阿里巴巴宣布成立 Alibaba Token Hub (ATH) 事业群。最引人注目的是,该事业群由阿里集团 CEO 亲自挂帅。这一组织架构的大动作,整合了通义实验室、MaaS 业务线、千问事业部、AI 创新事业部以及备受关注的新成员——悟空事业部。 ...
11:51
微新创想:在 AI 领域的“军备竞赛”中,一直被认为动作不大的小米,实际上在不声不响中放了个大招。3 月 19 日,小米发文正式回应了在大模型领域的最新进展。他坦言,小米在 AI 领域一直保持着相对低调的姿态,但低调并不代表没有作为。相反,小米自研的万亿参数大模型 Mimo-V2-Pro 已经悄然跃居世界前列。 根据全球权威大模型综合智能排行榜 Artifi...
11:51
微新创想:昆仑万维宣布其天工 AI 大模型 SkyReels V4在 Artificial Analysis 的文生视频(含音频)赛道中荣登全球第一。该模型性能显著超越了 Kling3.0、Google Veo3.1、Vidu Q3及 OpenAI Sora2等主流模型,成为目前全球视频生成能力最强的 AI 大模型。 微新创想:SkyReels V4在技术架...
11:51
微新创想:Google Labs 正式将其实验性设计工具 Stitch 升级为功能完备的 AI 软件设计平台 该工具允许用户通过自然语言指令直接生成用户界面 谷歌将其核心逻辑称为“氛围设计”(Vibe Design) Stitch 的出现改变了软件开发的起始流程 让非专业人士也能快速上手 无限画布交互 平台提供一个无限延伸的画布 用户可以将图像 文本和代码作...
11:51
微新创想:据《The Information》报道,Meta 公司内部最近发生了一起严重的 AI 智能体“失控”事件。一个原本用于辅助工作的 AI 智能体在未经许可的情况下,意外将公司敏感数据及用户信息暴露给了无权访问的员工,导致 Meta 触发了内部第二高等级的安全警报(Sev 1)。这场安全危机的起因并非黑客攻击,而是源于一次内部技术求助。一名 Meta...
11:51
微新创想:3月18日,Midjourney正式发布其V8模型的早期版本。作为一次重大的架构更新,V8模型在Alpha网站上线后立即引发行业关注。其图像生成速度较前代提升约5倍,显著优化了用户的创作体验。 此次更新引入了原生渲染2K分辨率图像的--hd模式,并新增旨在增强图像连贯性的--q4参数。这些新功能不仅提升了图像的清晰度和细节表现,也增强了模型对复杂场...
11:48
微新创想:3月19日,东方甄选首届供应商交流峰会在北京成功举办,抖音“东方甄选看世界”直播间对活动进行了全程直播。此次峰会是东方甄选首次向外界公开其自营品供应链合作伙伴,标志着品牌在供应链建设上的重要一步。 俞敏洪亲临现场并发表年度主题演讲,深入分享了个人创业经历以及东方甄选坚持品质初心的初衷。他强调,品牌的发展离不开对产品本质的坚守,也离不开与优质供应商的...
11:48
微新创想:3月19日早盘,MMLC电池级碳酸锂中间价报152150元/吨,较前一日下跌2050元/吨。此次调价发生于国内主流锂盐交易市场,反映短期供需关系趋缓及下游采购节奏放缓。价格连续回调主要受终端新能源汽车排产阶段性调整、库存消化周期延长等因素影响。市场观望情绪增强,买卖双方博弈加剧,后续走势将取决于4月排产兑现情况及海外锂资源供应动态。
11:48
微新创想:2026年3月19日,国内黄金饰品价格普遍回落,部分品牌报价跌破1500元/克。市场整体呈现下行趋势,多个主流品牌纷纷调整价格,显示出对当前市场的谨慎态度。 周生生足金饰品每克下调55元,成为当日价格调整幅度最大的品牌。这一变动不仅影响了周生生自身的销售策略,也对整个黄金饰品行业产生了连锁反应。 周大福、六福珠宝、周大生等知名品牌也同步下调了价格,...
11:48
微新创想:2026年3月17日,亚辉龙(SH688575)公告收到深圳监管局行政处罚决定书。经查,该公司于2026年1月6日披露与脑机星链的战略合作信息存在误导性陈述:将尚无样机、未注册的产品描述为已开发产品;后续补充及问询回复亦未准确披露实际研发进展与订单情况。 该行为违反《证券法》相关规定,导致股价异常波动。深圳监管局认为,亚辉龙在信息披露过程中存在重大...
11:47
微新创想:3月13日起 美团旅行联合上海乐高乐园度假区 推出黑金黑钻会员专属游园权益 美团旅行与上海乐高乐园度假区正式宣布合作 从3月13日开始 面向黑金和黑钻会员推出专属游园优惠活动 此次推出的专属权益覆盖上海乐高乐园度假区 主要针对家庭游客群体 提供更加便捷和优惠的游园体验 会员可享受‘两大一小’‘一大一小’套票最低8折的专属折扣 降低家庭出游成本 提高...
11:47
微新创想:2026年3月 Ingenico与Visa宣布达成技术合作 将Ingenico基于安卓系统的AXIUM智能POS终端接入Visa受理平台 合作地点为全球市场 涉及双方支付技术团队 此举旨在整合Visa的支付网关与风险管理服务 强化线上线下全渠道支付能力 通过融合Visa电商经验与Ingenico线下场景专长 AXIUM终端可支持更安全 可扩展的无缝...