最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2025年11月26日

06:09
华纳兄弟正积极寻求更优化的收购方案。据行业内部消息人士透露,这家知名娱乐巨头已向所有潜在竞购方发出明确通知,要求他们在12月1日前提交更具吸引力的报价,以争取更"甜蜜的交易条件"。这一举动清晰地反映出华纳兄弟对当前收到的报价尚未完全满意,希望通过引入竞争机制来推动交易价值的进一步提升。目前,关于具体参与竞购的各方以及他们的报价细节尚未对外公开,市场各方正密切...
06:09
2025年11月26日,OpenAI就备受关注的诉讼案正式发布官方回应,明确表示法院已全面掌握案件相关情况。公司特别强调,此次回应内容包含关于Adam精神健康的重要事实依据,旨在为外界提供权威信息,澄清可能存在的误解。OpenAI表示此举的核心目的在于确保司法程序的客观公正,维护法律尊严。同时,公司重申将一如既往地积极配合整个法律流程,与司法机关保持紧密沟通...
02:24
2025年11月26日,全球智能手机市场格局迎来重大变革。权威市场研究机构最新发布的数据显示,苹果公司正蓄势待发,有望在不久的将来超越三星电子,重新夺回全球最大智能手机制造商的宝座。这一历史性转变的背后,是苹果新款iPhone的卓越表现以及全球范围内蓬勃发展的用户换机需求。 得益于iPhone系列在技术创新和用户体验上的持续突破,苹果在中美两大核心市场的销量...
01:54
2025年11月25日下午,西班牙马拉加省埃尔庞蒂尔社区突发重大天然气泄漏事故,现场浓烟滚滚,气浪翻腾,造成4名居民不幸当场遇难。事故发生地位于马拉加市历史悠久的城区居民区,这一区域以保存完好的古建筑群和密集的居民楼而闻名。接到报警后,当地消防、应急救援及公共安全部门第一时间启动应急预案,迅速赶赴现场展开紧急处置,包括疏散周边居民、关闭燃气总阀、设置警戒区域...
01:22
2025年11月26日,社交电商巨头TikTok正式宣告进军奢侈品零售市场,这一战略举措标志着平台在高端消费领域迈出了关键一步。据悉,TikTok在其电商服务TikTok Shop上线了一款售价高达1.1万美元的限量版高端手包,这不仅是平台首次涉足奢侈消费品领域,更彰显了其进军高端市场的雄心。 在当前全球电商竞争日趋白热化的背景下,TikTok此举可谓精...
00:15
2025年11月11日,苹果正式发布与三宅一生联名的创新配件iPhone Pocket,这款产品以“一块布”为设计灵感,通过3D针织一体结构打造出独特的可穿戴形态,起售价为1299元人民币。iPhone Pocket提供短款和长款两种版本,分别满足用户不同的使用场景和搭配需求。该配件于11月14日起在大中华区及全球多个市场同步发售,但因其前卫的设计和较高的定...

2025年11月25日

23:45
2025年11月21日,英伟达CEO黄仁勋在一场备受瞩目的全员大会上发表了振奋人心的讲话,他向员工们传递出明确信号:人工智能时代,不必担忧失业。面对部分管理者要求员工减少使用AI工具的现象,黄仁勋毫不掩饰自己的反感态度,他坚定地指出,AI技术的应用绝非阻碍,而是推动企业发展的强大引擎。黄仁勋强调,英伟达在上个季度就成功新增了数千个就业岗位,并且公司目前仍在积...
23:45
2025年11月25日,备受瞩目的成都欧林生物科技股份有限公司正式向香港交易所递交了上市申请文件,标志着这家生物科技企业迈出了进军国际资本市场的重要一步。据悉,此次港股IPO的独家保荐机构由实力雄厚的中信证券担任,确保了项目在专业性和合规性上达到国际标准。根据利弗莫尔证券最新披露的信息,欧林生物的上市申请已正式进入审批阶段,这一关键动作不仅彰显了公司对资本市...
23:06
2025年11月25日,申菱环境正式宣布一项重要的资本运作计划——拟发行总额不超过10亿元人民币的可转换公司债券。这一举措旨在为公司未来的高速发展注入强劲动力,主要资金将投向两大核心领域:一是液冷新质智造基地项目的建设,二是补充企业流动资金。 该项目是申菱环境在液冷技术领域战略布局的关键一环,通过引入先进的智能制造理念和技术,将显著提升公司在该领域的核心...
23:06
昂利康于25日正式发布公告,宣布计划通过定向增发方式募集资金,总额不超过11.6亿元人民币。这笔资金将全部用于推进创新药的研发进程以及相关产业化项目。此次募资行动的核心目标在于显著提升公司的创新药物研发实力与产业化水平,同时推动产品结构的优化升级。据悉,该项目将覆盖多个创新药品种的研发、临床试验以及生产基地的建设等多个关键环节。通过本次募资,昂利康将有效增强...
23:06
2025年11月25日,大洋电机正式宣布与上河动量等多家知名机构达成战略合作,共同签署了《嘉兴智陆尚谷股权投资合伙企业(有限合伙)合伙协议》。据悉,该股权投资基金目标认缴规模高达10,015万元人民币,将全部聚焦于睿尔曼智能科技(北京)有限公司的战略投资。作为本次合作的有限合伙人,大洋电机将以自有资金出资1,000万元,认购基金份额,彰显了其在机器人产业领域...
23:06
2025年,尊界品牌将迎来重磅车型发布,计划推出两款SUV和两款MPV,涵盖标轴与长轴两种轴距版本,并特别推出S800高定版车型,总计6款新成员震撼登场。此次SUV车型将充分展现尊界品牌的豪华与性能,而MPV车型则精准定位家用与商用两个细分市场,分别满足不同用户群体的需求。据行业消息透露,尊界新车的售价将远超当前家用及商用MPV的主流价位,彰显其高端定位和卓...