最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2025年12月05日

08:32
近日,天文观测领域传来令人振奋的消息,太阳表面突然出现了一组规模庞大的黑子群,被天文爱好者们形象地比喻为“太阳脸上长出了密密麻麻的雀斑”。这些黑子不仅数量众多,而且个个“体格健壮”,其中最大的单个黑子直径更是惊人地达到了6至7个地球的大小,令人叹为观止。整个黑子群的结构错综复杂,呈现出令人着迷的形态。 太阳黑子,作为太阳光球层上常见的暗斑,实际上是磁场聚集的...
08:31
近日,一段触目惊心的监控视频在全球网络掀起轩然大波,画面中巴西男子罗纳德·蒙泰内格罗在健身房遭遇杠铃重击后的惨烈瞬间,将自由重量训练的安全隐患推向舆论风暴的中心。2025年12月1日,在巴西奥林达市的一家健身房内,55岁的罗纳德·蒙泰内格罗正在专注进行杠铃训练。训练过程中,杠铃意外脱手,数十公斤重的钢铁重物狠狠砸向他的胸部。监控画面清晰记录了这一致命瞬间:罗...
08:31
12月4日,一则令人瞠目结舌的意外新闻引发了社会广泛关注:一名女子骑电瓶车时突然摔倒,更令人震惊的是,她头部被自己佩戴的鲨鱼夹扎破,鲜血直流。据女子回忆,此前她曾偶然看到类似新闻,却从未想过这种危险场景会降临到自己身上。这次惊魂未定的经历让她深感后怕,也促使她向公众发出强烈警示:使用鲨鱼夹时必须时刻保持警惕,确保安全。 鲨鱼夹作为当下深受年轻女性喜爱的时尚发...
08:11
2025年12月2日,备受期待的平板电脑一加Pad Go 2悄然亮相Geekbench跑分平台,引发科技爱好者热议。这款新机搭载了一颗强大的八核处理器,其中包含4颗主频高达2.5GHz的大核与4颗2.0GHz的小核,确保了卓越的多任务处理能力。其图形处理单元选用ARM Mali-G615 MC2,配合8GB大容量内存,在单核测试中取得了1065分的优异成绩,...
08:11
2025年12月4日,科技界迎来重要人事变动,苹果公司正式任命资深设计师史蒂夫・勒梅(Stephen Lemay)担任新任用户界面设计主管,接替此前加入Meta的艾伦・戴伊。这一任命不仅标志着苹果在用户体验设计领域的重要布局,也彰显了公司对创新设计的持续投入与高度重视。 勒梅自1999年加入苹果以来,已深度参与公司核心产品的设计工作。他不仅是初代iPhone...
08:11
2026年7月1日,微软将正式推出Microsoft 365商业订阅产品的全球性价格调整方案,同时同步升级AI、安全与管理三大核心功能,为企业数字化转型提供更强大的技术支撑。此次重大更新将深度整合Copilot Chat智能助手至Office系列应用中,通过自然语言交互大幅提升办公效率;同时全面强化安全防护体系,并显著增强设备管理能力,帮助企业从容应对日益严...
08:11
2025年12月5日,微软正式向Windows 11用户推出备受期待的“运行”(Win + R)对话框全新改版,代号“Modern Run”。这一重大更新标志着该功能自1995年随Windows 95首次亮相以来的首次彻底革新,微软通过引入Fluent Design设计语言,为这一经典功能注入了现代化的视觉体验。 此次改版不仅支持深色模式,更创新性地加入了应...
07:40
德国杜伊斯堡-埃森大学的科研团队于12月5日发布了一项突破性研究成果,成功开发出一种创新自动化技术,能够高效批量生产微型肺类器官。这项具有里程碑意义的发现已正式发表在《生物工程与生物技术前沿》国际权威期刊上,标志着体外肺模型研究领域迈入新纪元。 该团队培育的微型肺类器官在细胞结构和功能上高度模拟真实肺组织,其精密的微结构能够准确反映人体肺部组织的复杂特性。这...
07:40
2025年12月5日,微软为Windows 11用户推出的11月可选更新KB5070311引发了广泛争议。大量用户报告遭遇安装失败、深色模式下文件资源管理器频繁白屏闪烁、登录界面密码图标消失等严重问题。更令人担忧的是,部分搭载英特尔Arc独显的用户在更新后遭遇蓝屏或黑屏死机,无法正常使用系统。其中,0x80070306等错误代码频繁出现,迫使部分用户不得不进...
06:40
12月5日凌晨5时27分,西藏昌都市江达县突发3.3级地震,震源深度达10千米。经初步核实,震中坐标位于北纬31.12度、东经98.54度。截至最新消息,当地尚未收到人员伤亡及财产损失的报告,社会秩序总体稳定。此次地震虽未对周边地区造成明显影响,但相关部门已加强监测预警,确保及时应对可能出现的次生灾害。地震发生时,部分居民感受到轻微震动,但未出现恐慌性撤离现...
05:09
2025年12月5日,美国零售巨头塔吉特公司正式宣布启动一项创新性的隔天送达配送服务试点计划。这项旨在全面提升物流效率与顾客购物体验的新举措,目前已在全美部分重点门店展开测试。通过深度整合门店实时库存数据与本地配送网络资源,塔吉特能够实现订单的极速响应与高效交付,将商品配送时效压缩至传统模式的两天以内。 此次试点被视为塔吉特应对电商巨头激烈竞争、强化供应...
05:09
2025年12月5日,科技行业传来重磅消息。据权威媒体The Information独家披露,高性能计算云服务平台FluidStack正积极筹备新一轮巨额融资。此次融资金额预计将突破7亿美元大关,创下行业新纪录。本轮融资吸引了多家国际顶尖投资机构的目光,包括多家在科技领域享有盛誉的国际知名投资机构参与其中,具体合作细节仍在紧张协商阶段。 据悉,FluidSt...