最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年03月10日

01:42
微新创想:2026年3月10日,苹果面向开发者推送iOS/iPadOS 26.4开发者预览版Beta 4(版本号23E5234a) 此次更新距离Beta 3发布仅隔7天,属于常规迭代节奏。苹果持续以高频次的方式推进系统优化,确保最终版本的稳定性和用户体验 该版本适用于iPhone和iPad设备,开发者需先注册苹果开发者计划,才能通过“设置→通用→软件更新”渠...
01:42
微新创想:2026年3月10日,苹果向注册开发者推送了macOS 26.4开发者预览版Beta 4(内部版本号25E5233c)。此次更新距离Beta 3的发布仅隔6天,属于常规迭代节奏。苹果在短时间内连续发布多个测试版本,显示出其对新系统的重视程度以及快速推进开发工作的策略。 升级该版本需要开发者登录苹果开发者账号,并通过系统设置中的“通用→软件更新”选项...
01:42
微新创想:2026年2月,空中客车公司全球交付飞机35架,当月净增订单28架。今年1至2月累计获得飞机订单77架。交付与订单均按计划推进,反映民航市场复苏态势持续。数据于3月10日由空客官方公布,覆盖全球各主要航司及租赁客户。
01:42
微新创想:2026年3月10日,AI语音技术公司ElevenLabs首席执行官宣布,公司拟在未来2至3年内完成首次公开募股(IPO)计划。这一消息标志着ElevenLabs在人工智能语音领域的发展迈入了新的阶段。 ElevenLabs总部位于英国伦敦,专注于生成式语音AI的研发与商业化应用。公司致力于通过先进的语音合成技术,为用户提供更加自然、高质量的语音体...
01:10
微新创想:2026年3月9日 地中海航运公司宣布 自3月16日起对北欧至红海航线实施紧急燃油附加费 标准集装箱收费85美元每箱 冷藏箱收费125美元每箱 该费用将适用于所有经此航线的订舱货物 此次调整是为应对近期红海地区航运风险上升及燃油成本波动所采取的措施 燃油附加费将在提单签发前由承运方收取 这一变动可能对货主的运输成本产生直接影响 地中海航运公司表示 ...

2026年03月09日

23:54
微新创想:微软近日确认Windows 11任务栏日历弹出功能不会被取消,而是正在积极优化其底层体验以确保整体质量。这项功能原本计划在2025年12月启动预览测试,但因技术调整和稳定性问题,最终被推迟。目前微软表示,将在未来几个月内向Windows预览体验成员开放测试,以便收集更多反馈并进行改进。 该功能的回归将为用户提供极大的便利,使他们无需打开特定应用程序...
23:21
微新创想:2026年3月9日 博主@数码闲聊站爆料称 某国产头部厂商母系旗舰正评估1.5K分辨率+165Hz超高刷新率显示屏 结合其过往爆料风格及一加已量产多款165Hz机型 如一加15、Ace 6、Ace 6T、Turbo 6 业界普遍指向OPPO体系 一加中国区总裁李杰此前确认 一加15搭载的第三代东方屏为行业首块1.5K+165Hz屏幕 并已适配《三角...
23:21
微新创想:3月9日,日本软银集团旗下电子支付平台PayPay在美国启动首次公开募股(IPO)获得数倍超额认购。此次IPO由高盛、摩根士丹利等国际知名金融机构牵头承销,计划募集资金约20亿美元。该笔资金将主要用于拓展北美及东南亚市场,进一步推动PayPay的全球化进程。 PayPay自2018年在日本正式运营以来,迅速积累了庞大的用户基础,目前服务用户已超过4...
23:21
微新创想:3月9日,江苏泽景汽车电子股份有限公司正式通过港交所上市聆讯。这一重要进展标志着公司在资本市场的发展迈出了关键一步。公司总部位于江苏省,专注于汽车电子产品的研发与制造,凭借多年的技术积累和市场拓展,已在行业内占据了一定的市场份额。 此次IPO计划募集资金将主要用于产能扩建、技术研发以及补充流动资金。通过扩大生产规模,公司有望进一步提升市场竞争力;加...
22:13
微新创想:大众与众汽车正式公布08车型内饰官图 3月9日,大众与众汽车正式公布08车型内饰官图 该车定位为中大型智能电动SUV 轴距达3030mm,为车内空间提供了充足保障 配备双14.96英寸超高清智能联屏 以及1.74㎡智能调光天幕 紫外线隔绝率达99.9% 有效提升驾乘舒适度与安全性 内饰配置丰富,包含14向电动调节副驾座椅 并配有腿托功能 进一步提升...
22:13
微新创想:OPPO于2026年3月9日上午宣布,全新折叠旗舰手机Find N6将于3月17日19时全球首发。这款手机在设计和技术上进行了多项创新,旨在为用户提供更优质的折叠屏体验。 Find N6搭载了最新的骁龙8 Elite Gen5处理器,性能表现将更加出色。主屏幕采用8.12英寸2K LTPO技术,不仅显示效果细腻,还具备出色的功耗控制能力。副屏则为6...
21:43
微新创想 宁德时代今日公布2025年财报数据显示全年营收达到4237.02亿元同比增长17.04%净利润为722.01亿元同比增长42.28% 微新创想 2025年宁德时代动力电池销量达到541GWh同比增长41.85%全球市占率再创新高根据SNE Research统计2025年宁德时代全球动力电池使用量市占率提升1.2个百分点至39.2%连续第九年保持...