最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2025年12月18日

06:52
2025年12月18日,科技巨头Meta公司正式宣布暂停其混合现实操作系统Horizon OS的第三方设备合作计划。这一战略调整标志着Meta将重心转向自研软硬件产品,致力于推动虚拟现实市场的创新与进步。该合作计划自2024年4月启动以来,旨在构建一个开放多元的硬件生态系统,但实际进展远未达预期,进展缓慢成为项目面临的主要挑战。 随着人工智能技术的崛起,Me...
06:52
2025年12月18日,美光科技首席执行官在公开场合明确指出,当前全球内存市场面临的供应紧张局面预计将持续至2026年之后。这一判断主要基于两大核心因素:一是服务器需求始终保持强劲增长态势,二是人工智能技术的迅猛发展正不断推动数据存储需求的升级换代。美光作为全球内存产业的领军企业之一,其前瞻性的市场预测不仅揭示了高端内存市场在未来几年内将保持高速增长的潜力,...
06:52
2025年12月18日,OpenAI重磅宣布了一项具有里程碑意义的创新举措——开发者现在可以自由向ChatGPT平台上传并部署自研应用程序。这一开放策略将极大地赋能开发者,使其能够将个性化的应用无缝集成到ChatGPT的庞大生态系统中,从而显著增强平台的功能扩展能力,并带来更加丰富多元的用户体验。该平台特别强调,这一功能面向全球开发者全面开放,充分体现了Op...
06:51
2025年12月18日,北京五一视界数字孪生科技股份有限公司正式宣布启动在香港交易所的首次公开募股(IPO)计划。此次IPO规模宏大,公司计划发售2397.5万股,每股发行价定为30.5港元,预计将筹集近7.3亿港元资金。 这笔募集的资金将重点投向技术研发和业务拓展两大领域。五一视界作为数字孪生领域的先行者,将持续加大在人工智能、大数据、云计算等前沿技术...
06:51
12月18日清晨至上午时段,我国北方及华东部分地区将遭遇大雾天气的严重影响。具体影响范围包括河北中部、河南东南部、安徽中部、湖北东部以及浙江北部等地。其中,河北中部、河南南部、安徽中部、湖北东部及四川盆地东南部部分地区将出现能见度低于500米的浓雾,局部地区能见度甚至不足200米,对出行造成极大困扰。 中央气象台已于当日凌晨6时正式发布大雾黄色预警,紧急提醒...
05:51
2025年12月18日,全球知名企业家埃隆·马斯克在一场备受瞩目的公开演讲中透露,其领导的人工智能公司xAI有望在2026年取得重大突破,实现人工通用智能(AGI)的里程碑式进展。这一概念意味着AI系统将在所有认知任务上全面超越人类智慧水平,开启人工智能发展的全新纪元。 马斯克在讲话中特别强调,当前人工智能领域的发展速度已远超行业普遍预期。他透露,xAI团队...
05:51
2025年12月18日,欧洲航空安全局(EASA)紧急发布安全建议,要求对欧洲地区运营的空客A320系列部分飞机进行专项检查。此次行动的核心问题指向由空客某供应商提供的机身壁板,由于在生产环节出现质量瑕疵,部分壁板的实际厚度可能未能达到既定安全标准。据了解,涉及此次检查的飞机数量尚未正式公布,但主要集中在对欧洲航线运营的A320系列客机。 EASA在官方声明...
05:51
德国知名金属企业莱茵金属公司(RHM)近日正式宣布启动民用部门的剥离计划,标志着其战略转型迈出关键一步。目前,该公司正与两家潜在收购方进行深入磋商,预计在2026年第一季度完成合同签署,实现资产出售。此次剥离行动的核心目标在于优化整体业务结构,使公司能够更加聚焦于防务领域这一核心产业,从而提升竞争力和市场地位。 根据公司最新披露的信息,莱茵金属将为即将剥离的...
05:51
2025年12月18日,全球领先的媒体公司康卡斯特正式对外宣布,将其旗下核心媒体部门的价值评估为810亿美元。这一极具分量的估值数字,不仅彰显了康卡斯特对该业务板块的坚定信心,更揭示了其在未来媒体格局中的战略布局。据悉,此次交易的核心是康卡斯特与华纳兄弟探索公司(WBD)之间展开的深度合作,双方将在有线电视服务、流媒体平台以及内容制作等多个关键领域进行资源整...
05:51
2025年12月18日,Octagon Credit Investors LLC的高级投资组合经理Lauren Law在行业研讨会上指出,信贷贷款 Obligation(CLO)市场正迎来前所未有的发展机遇,其核心驱动力源于投资者群体的显著拓宽。随着越来越多的机构投资者将目光投向这一领域,交易所交易基金(ETF)等零售投资渠道对CLO产品的兴趣也日益浓厚,呈...
04:50
12月18日凌晨3时01分,新疆阿克苏地区沙雅县突发4.0级地震,震源深度仅10公里,显示出较强的浅层地质活动特征。根据地震监测数据,震中位于北纬41.07度、东经83.35度,该区域属于新疆地震活动频发带,此次地震虽未造成人员伤亡和重大财产损失,但依然引起了广泛关注。 地震发生后,相关部门已迅速启动应急响应机制,专业团队正对震区地质结构进行详细评估,以全面...
04:50
2025年12月17日,世界卫生组织发布最新监测报告,指出今年流感在欧洲的传播时间较往年提前了约四周,呈现异常活跃态势。目前已有38个国家向世卫组织报告了流感数据,其中27个国家流感活跃度达到"高"或"极高"级别,多个欧洲国家正经历严峻的流感疫情。 爱尔兰、英国等欧洲多国最新数据显示,超过半数的流感样病例已确诊为流感病毒感染,其中甲型H3N2毒株占据近90%...