最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年03月18日

08:11
微新创想:Meta公司宣布其元宇宙平台Horizon Worlds将于2026年6月15日正式停止VR端支持并从Quest商店下架。这一决定意味着VR用户将失去访问个人创作世界以及“Horizon Central”等官方场景的能力。自2026年3月31日起Quest用户将无法再进入这些内容。而到了6月15日之后平台仅会保留iOS和安卓的2D版本供用户使用。 ...
08:11
微新创想:2026年3月18日,Spotify面向Windows平台Premium用户正式推出“Exclusive Mode”高解析无损播放功能。这一功能的推出标志着Spotify在音频播放技术上的进一步突破,为用户带来更高质量的音乐体验。 Exclusive Mode使Spotify应用能够直接接管系统的音频链路,从而绕过通常由操作系统进行的重采样与混音等...
08:11
微新创想:微软近日宣布自2025年8月下旬起,将全面实施Clipchamp视频编辑项目仅支持保存至OneDrive的政策。这意味着所有使用Windows 11内置Clipchamp免费版的用户,其本地存储的项目将不再显示在应用界面中,也无法直接进行编辑操作。 此次更改要求用户必须将之前保存在本地的视频编辑项目迁移至OneDrive,才能继续进行后续的编辑工作...
08:11
微新创想:截至2025年底,蚂蚁基金权益类基金保有规模突破1万亿元,成为国内首家达成该规模的基金代销机构。这一成绩不仅体现了蚂蚁基金在市场中的强大影响力,也标志着其在基金销售领域的领先地位。 事件发生于中国境内,主体为蚂蚁基金,系第三方基金销售平台。作为国内领先的互联网金融服务平台,蚂蚁基金凭借其庞大的用户基础和先进的技术能力,持续推动基金销售业务的发展。 ...
08:11
微新创想:3月18日,斑马智能信息技术股份有限公司正式向香港交易所递交上市申请。该公司总部位于中国,主营业务涵盖智能驾驶系统研发与商业化落地。此次IPO拟募集资金用于技术研发、市场拓展及补充营运资金。申请由中金公司与摩根士丹利担任联席保荐人。若顺利通过审核,斑马智能或将成为年内首家在港上市的智能驾驶领域科技企业。
08:11
微新创想:3月18日,美国莱斯大学与新加坡南洋理工大学等机构联合团队在运行中的锂金属电池内首次直接观测到锂枝晶的完整生长与断裂动态过程。这项突破性研究在室温常压条件下进行,利用原位电化学透射电镜技术实现了纳米级别的实时成像。研究人员能够清晰地捕捉到锂枝晶在充放电过程中如何形成、扩展并最终断裂。 这一发现揭示了锂枝晶具有显著的脆性特征,并表现出周期性断裂的行为...
08:11
微新创想:2026年3月18日,意大利米兰理工大学联合国家研究委员会光子学与纳米技术研究所等机构,成功研制出由光控制的超高速计算机。这项突破性成果标志着信息处理技术迈入了一个全新的阶段。研究人员采用了一种全新的方法,利用飞秒激光脉冲在新型二维半导体材料中执行逻辑运算,使得计算机的运算速度远超当前最快的电子器件,达到了百倍以上的提升。 微新创想:这项研究的最大...
07:37
微新创想:3月18日,美国得克萨斯州农工大学与陆军研究实验室合作,成功研发出一种新型的‘超级泡沫’材料。这种材料通过将普通泡沫与3D打印的弹性支柱进行复合,展现出卓越的性能。相比传统泡沫,其能量吸收能力提升了10倍,不仅在强度上有了显著增强,同时保持了低成本和轻质的特性。 微新创想:该材料的耐用性也得到了大幅提升,使其能够在多种极端环境下保持稳定性能。研究人...
07:37
微新创想:2026年3月18日,沪深交易所本年度首批港股通标的调整正式生效。此次调整共新增42只港股,其中生物医药企业占据13家,占比超过30%。这不仅体现了资本市场对生物医药行业的高度关注,也标志着国家将生物医药列为新兴支柱产业后,资本市场首次作出集中响应。 微新创想:随着新增标的的纳入,南向资金可以直接投资尚处于研发阶段的未盈利生物科技企业。这一变化为这...
07:37
微新创想:据悉《深海迷航2》将于2026年5月在Xbox和PC平台开启抢先体验 此举源于开发商Unknown Worlds与发行商KRAFTON就高管解雇及奖金纠纷达成阶段性和解 法院裁定KRAFTON须支付2.5亿美元奖金并恢复CEO Ted Gill职务 此前双方因管理权与薪酬争议陷入诉讼 影响开发进度 目前团队已通过里程碑审查 正全力推进EA版本 官方...
07:37
微新创想:2026年3月18日,苹果公司在中国成都太古里店及韩国首尔明洞店同步启动成立50周年庆典活动。此次活动是苹果公司3月全球庆祝计划的重要组成部分,旨在为即将到来的4月1日公司成立50周年营造浓厚氛围。 成都太古里店当天临时闭店,现场正在进行舞台搭建,预计将举办一场音乐或舞蹈表演。这一安排不仅为顾客提供了独特的体验,也展现了苹果在本地市场持续创新与互动...
07:37
微新创想:2026年3月,Bethesda游戏总监陶德·霍华德证实,《上古卷轴6》已全面采用自研Creation Engine 3引擎。这一升级不仅提升了游戏的开发效率,还显著优化了整体流程。相比前作《星空》在引擎迭代过程中出现的团队停工与构建崩溃问题,Creation Engine 3为《上古卷轴6》的开发提供了更加稳定和高效的平台。 霍华德在采访中透露,...