最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年01月02日

17:18
2026年1月2日,韩国青瓦台迎宾馆内庄重非凡,一场特殊的国家级颁奖仪式在此举行。韩国总统李在明亲自为英雄联盟传奇选手Faker(李相赫)授予象征电竞荣耀的国家级勋章——青龙章,以此表彰他在电竞领域所取得的非凡成就。 Faker此次获颁青龙章,主要为了表彰他在电竞领域的卓越贡献,尤其是带领T1战队勇夺S15全球总决赛冠军,成功实现S赛三连冠伟业,并达成个...
17:18
2025年12月30日,前R星技术总监奥比・费尔迈对外媒表示,《GTA4》虽在角色塑造上表现出色,尤其是主角Nico Bellic被视为系列最丰满角色,但游戏为追求现实主义叙事牺牲了玩法多样性。他指出,《GTA4》任务结构重复,局限于跟踪、清场等少数模式,缺乏《圣安地列斯》时期的创意与自由度。相比之下,《GTA5》回归娱乐化风格,任务设计更丰富,反映出R星...
17:18
2026年1月2日,米其林公司宣布将收购库利集团和特克斯泰克工业公司。此次收购旨在强化其在聚合物复合材料解决方案领域的业务能力。库利集团专注于高性能材料研发,而特克斯泰克工业公司在复合材料制造方面具有领先技术。通过整合两家公司的技术与资源,米其林计划提升其材料科学创新能力,以支持可持续出行领域的发展需求。交易具体金额未披露。
17:18
2026年1月2日,全球领先的IT解决方案提供商三星SDS正式宣布了一项雄心勃勃的投资计划,将投入高达4273亿韩元的巨额资金用于建设新一代人工智能数据中心。这一战略项目选址于韩国京畿道华城市,由三星SDS独立主导并全面负责实施。该投资旨在显著增强公司在人工智能与云计算领域的核心竞争力和基础设施实力,为未来智能技术的快速发展奠定坚实基础。 据悉,新数据中心将...
17:18
1月2日清晨,韩国济州岛国际机场发生一起罕见的安全事件。一架原计划执行济州至浦项航班的客机在起飞前突然出现冒烟现象,引发乘客和机组人员的紧急应对。据现场目击者描述,浓烟从飞机尾部散发,随即在机舱内弥漫开来,情况一度十分危急。 随着烟雾浓度不断加剧,机长果断启动应急预案,通过广播指挥120名乘客迅速有序地撤离飞机。乘客们在机组人员的引导下,通过紧急出口有序撤离...
16:48
2026年1月2日,备受瞩目的领克08 EM-P 230超长续航Ultra版正式登陆市场,官方指导价为20.58万元起,更推出限时优惠,仅需18.98万元起即可入手。新车在延续现款车型经典设计语言的基础上,融入了更多前沿科技元素,如璀璨星河LED大灯组与智能驾驶辅助的“小蓝灯”,不仅提升了夜间辨识度,更彰显了科技感。 车身尺寸方面,领克08 EM-P 230...
16:47
2026年1月1日,smart精灵#1马年开运版正式上市,售价13.99万元,限量1000台。新车延续现款车型设计,推出“红运上头”“福气接头”等四款专属好运车顶,营造节日氛围。外观采用贯穿式LED灯带与封闭式格栅,内饰配备9.2英寸仪表盘与12.8英寸中控屏,科技感十足。动力方面,搭载后置单电机,最大功率250千瓦,提供410km、545km和570km...
16:47
2026年1月2日,苏宁易购Suning Max甘青宁首店在兰州西关商圈正式开业。该店位于兰州市城关区交通枢纽与中山桥景区旁,地处核心商圈,总面积超3.3万平方米,共六层。门店汇聚超100家头部家电与3C品牌,并引入30余家区域首发旗舰体验馆。此次开业标志着苏宁易购在西北市场大店布局迈出关键一步,进一步强化其在西部地区的零售影响力。
16:47
截至2030年,欧洲银行可能裁员超20万人。摩根士丹利报告显示,AI和数字化推动下,中后台、风控与合规等部门成裁员重点。对35家银行的测算显示,目前212万员工中约一成岗位面临削减。荷兰ABN Amro计划2028年前裁减五分之一人力,法兴银行称降本“无禁区”。瑞银已启用AI生成分析师视频,并组织高层赴牛津培训。尽管AI可提升约30%效率,但摩根大通高管警...
16:47
1月2日,淘宝闪购正式启动2026年货节,主打“30分钟送到家”服务。活动围绕团聚、出行、礼赠、装扮玩乐四大场景,提供全品类年货购物方案。用户可领取最高2026元券包,并享多档满减优惠,覆盖百货、超市、酒水、生鲜等品类。此次年货节通过即时配送网络,满足消费者快速置办年货需求。
16:47
2026年1月1日,山东港口青岛港迎来历史性时刻——全国首套真空式自动系泊系统正式投入运行。在“地中海沙特阿拉伯”号货轮的靠泊作业中,该系统以惊人的效率在30秒内完成全自动对接,彻底颠覆了传统依赖人工操作的模式。这一创新技术的核心在于其先进的智能算法与多传感器感知系统,巧妙融合了高负压真空吸附技术,能够实时捕捉并应对风浪流等复杂海况变化,确保船舶实现快速而精...
15:47
2026年元旦期间,休闲玩乐消费活力强劲。数据显示,上海、北京、深圳等城市位列消费规模前十。受跨年及年底聚会等因素推动,KTV成为服务消费“黑马”。美团统计显示,元旦前两周,KTV交易规模同比增长近三成,需求显著上升。