最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年01月17日

21:08
2026年1月17日,德石股份传来振奋人心的消息,其自主研发的超耐磨高压酸化压裂软管成功斩获北美市场首笔高端订单。这一里程碑事件不仅彰显了德石股份在高端油田装备领域的卓越技术实力,更标志着公司正式迈入全球油气勘探开发技术的前沿市场行列。此次订单的成功获取,充分验证了德石股份产品在严苛工况下的可靠性能和卓越竞争力,为公司在国际市场的持续扩张奠定了坚实基础。随着...
21:08
HMD近日公布DUB X50 Pro真无线耳机,支持主动降噪与蓝牙5.3。该耳机采用入耳式设计,搭载DUB白金音效技术,配备四麦克风矩阵和AI降噪,提供蓝色、灰色两种配色,支持IPX4级防水。内置70mAh耳机电池和600mAh充电盒,最长续航达60小时,支持USB-C快充,充电10分钟可播放185分钟。产品已于官网发布,旨在提升音乐细节与通话清晰度。
20:37
2026年1月17日,阿维塔公司就1月6日发生在南宁的严重交通事故正式发布官方声明。这起事件中,一辆阿维塔07车型在超速行驶状态下连续撞击了15辆其他车辆,造成重大影响。根据当地交警部门出具的最终认定结果,驾驶员在此次事故中承担全部责任。 阿维塔公司通过声明强调,事故发生时该车辆的辅助驾驶系统并未处于激活状态,且车辆安全气囊正常弹出,符合安全设计标准。公...
20:37
2026年1月17日,GNOME 50桌面环境在GNOME Shell中合并新功能,可在设定就寝时间后阻止用户解锁电脑。该功能属“数字健康”项目,管理员可设置睡眠时段,届时系统禁止解锁,也可选择延长使用时间。此举旨在帮助用户管理屏幕使用时长。同期更新还包括Nautilus文件管理器支持Git管理应用Turtle、主题自定义工具Rewaita,以及发布GNO...
20:37
2025年,我国全社会用电量达103682亿千瓦时,同比增长5.0%,首次突破10万亿千瓦时大关。第一产业用电量1494亿千瓦时,增长9.9%;第二产业66366亿千瓦时,增长3.7%;第三产业19942亿千瓦时,增长8.2%;居民生活用电15880亿千瓦时,增长6.3%。第三产业与居民用电对增长贡献率达50%。其中,充换电服务业和信息传输、软件业用电增速...
20:06
2026年1月15日下午,顺丰航空O3263航班从南京禄口国际机场顺利起飞,标志着南京至台北的定班货运航线正式投入运营。这条全新的航空货运通道由波音757-200全货机执飞,每周稳定运行2个班次,不仅实现了南京与台北之间固定班期、固定时刻的运输服务,更开创了两岸间首条公开销售的固定时刻航空货运航线。这一重要举措由南京交控航空物流、顺丰航空以及苏瑞亚(南京)航...
19:35
1月17日最新消息,多家权威媒体联合报道了一则来自重庆美心有限公司的重要动态。近日该公司正式发布致全体员工的公开信,透露了2025年度公司经营面临的严峻挑战——制造业应收账款持续高企,非制造业板块经营业绩未达既定目标。尽管如此,为彰显对全体员工辛勤付出的高度认可与感谢,公司管理层经过慎重研究决定,自2026年起为每位员工每月上调薪资20元人民币。信中同时表达...
19:35
2026年1月17日,备受瞩目的中央广播电视总台《2026年春节联欢晚会》首次彩排圆满落幕,标志着这场视听盛宴正加速进入完美呈现阶段。据悉,本届晚会将前沿科技与传统文化巧妙融合,通过AI人工智能、AR增强现实、XR扩展现实等尖端技术,精心打造出极具沉浸感的舞台效果,让观众仿佛置身于一个充满奇幻色彩的新年梦境之中。 生肖马元素作为贯穿全场的创作主线,不仅体...
19:35
2026年1月14日,索尼、任天堂和微软联合宣布升级“安全游戏”准则,聚焦预防、合作与责任三大方向,强化玩家特别是未成年人的保护。三方将提供更易用的安全控制工具,并向家长普及使用方法。同时,将与行业组织、监管机构及执法部门协作,推动网络安全倡议,配合ESRB、PEGI等分级机构确保内容适龄。平台还将优化举报机制,制定社区行为规范,对违规行为采取处罚措施,并...
19:05
七工匠近日在海外市场发布75mm f/1.25 Mark II全画幅手动对焦镜头,适配徕卡M卡口,支持转接。该镜头采用6组7片结构,含ED和HR镜片,最大光圈f/1.25,适用于人像、舞台等题材。其光圈环与对焦环刻度具备发光设计,便于夜间操作。镜头重514克,长79mm,滤镜口径65mm。目前已上市,售价469美元(约3276元人民币)。
18:34
2026年1月17日,萝卜快跑与AutoGo在阿布扎比携手开启全无人驾驶出行服务新篇章。即日起,用户即可通过AutoGo App在亚斯岛便捷预约无人驾驶车辆,未来服务范围将逐步覆盖更广阔区域。这一重要里程碑不仅是中国无人驾驶技术首次在海外实现商业化落地,更为全球自动驾驶的国际化发展注入强劲动力。此次合作充分展现了两国在智能出行领域的创新实力,预示着未来无人驾...
18:34
1月17日,知名企业家罗永浩通过个人朋友圈发布重要声明,正式宣布将不再就西贝预制菜相关争议进行个人层面的回应。他同时透露,自己的微博账号已被平台禁言15天,并坦言这种禁言状态反而成了一种保护。罗永浩明确表示,未来将不再就此事发表任何个人言论,将把精力集中在更有价值的商业议题上。 在声明中,罗永浩展现出对行业监管的期待,他相信随着预制菜行业的发展,透明化相关法...