最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2025年11月27日

09:20
微新创想11月27日消息,日前,华为宣布将于12月11日在迪拜举行全球发布会,正式发布新一代折叠屏旗舰Mate X7。据了解,华为Mate X7国内售价12999元起,作为华为最强折叠屏旗舰,该机实现了从内到外的全面突破。华为Mate X7全系搭载麒麟9030 Pro处理器,典藏版可选20GB内存版本,是华为目前内存最大的折叠屏...
09:20
微新创想11月27日消息,昨晚的理想汽车2025Q3财报会议上,理想汽车CEO李想表示:未来10年,具身智能最有价值的产品一定是具备自动和主动能力的汽车”。在李想看来,汽车行业的产品定位需跳出电动车”与智能终端”的局限。若仅将产品定义为电动车”,竞争会陷入参数比拼的红海,续航、车长等指标的细微差异难以创造核心价值,且更强传感器、...
09:20
微新创想11月27日消息,自从iPhone X开启人脸识别时代之后,很多安卓机也曾跟进过类似技术,但至今为止除了苹果也就只有华为、荣耀一直在坚持。荣耀研发工程师荣耀曹工”今天发文回应了网友的疑问,这个不仅仅只是堆个器件就行的,需要针对芯片平台、系统和算法做定制化协同改造和升级:首先,需要针对芯片平台的图像通路和运行环境进行定制化...
09:20
微新创想11月27日消息,据博主数码闲聊站透露,联想系定了一块6.7-6.8英寸大尺寸1.5K LCD屏幕,以及一块6.5英寸中尺寸LCD屏幕,预计对应机型在明年登场。其中,大尺寸1.5K LCD屏幕的规格比较受关注,这刚好与之前京东方发布的高端手机显示解决方案相符。据悉,京东方在9月宣布推出基于ADS Pro技术的高端手机显示...
09:20
近日,抖音电商官方发布消息,针对直播平台中出现的诈骗行为,特别是 “AI 工具转赠” 等骗术,抖音电商决定开展 “直播诈骗引流专项治理” 行动。在日常巡查中,平台发现一些主播利用虚假宣传和诱导手法进行诈骗,主要表现为虚构高收益课程、误导商品材质以及伪造个人身份等。此次专项治理的重点是确保平台的交易环境合规、透明,保护消费者权益。抖音电商强调,将持续加强巡查,...
09:20
Adobe 正式发布了革命性的创意系统 Project Graph,旨在为 AI 时代重新定义创作流程。这一创新平台专为艺术家和设计师打造,通过赋予更强的控制权和自定义能力,彻底解决了传统 AI 工具在创作中面临的两大核心痛点——对文本提示的过度依赖以及创作过程的不确定性。Project Graph 的核心是一个基于节点的可视化编辑器,用户能够通过图形界面,...
09:20
清华大学近日重磅发布《清华大学人工智能教育应用指导原则》(以下简称《指导原则》),标志着该校在人工智能教育领域迈出重要步伐。这是清华大学首次以系统化框架的形式,对校园内人工智能技术的应用进行全面规范与科学引导,其覆盖范围广泛,重点聚焦于教学、学术研究等核心教育活动。这份具有里程碑意义的《指导原则》由"总则""教学篇""学位论文及实践成果篇"三大部分构成,内容...
09:20
微软近期为 Edge 浏览器推出了一项革命性的 AI 购物增强功能,旨在彻底改变用户的在线购物体验。内置的 Copilot 功能现已全面支持价格比较、历史价格追踪以及返现信息展示,让用户能够更直观、更高效地做出购买决策。这一创新功能的设计理念在于通过智能分析,为用户提供全方位的购物参考信息。 要开启这一便捷功能,用户只需轻点 Edge 浏览器侧栏的 Copi...
09:20
软银集团近日宣布达成一项重大战略交易,通过其子公司Silver Bands6以全现金方式成功收购了独立芯片设计公司Ampere Computing。这笔交易的总金额高达65亿美元,标志着软银在人工智能和云计算领域的又一重要布局。根据协议,Ampere Computing在收购完成后将继续作为软银的全资子公司独立运营,并保留原有品牌标识。其财务及运营数据将从收...
09:20
近日浙江大学哲学学院与豆包公司在浙大紫金港校区正式签署合作协议,并隆重揭牌全新的“AI人文创新实验室”。这一创新举措标志着哲学领域与人工智能技术深度融合的新篇章。哲学学院院长王俊在签约仪式上强调,该实验室的核心目标并非简单地将技术与人文知识进行表面结合,而是要构建一个"人文引领技术、技术反哺人文"的全新共生体系。通过系统化的跨学科合作,实验室将致力于培养兼具...
09:20
Google DeepMind正式发布了Gemini3Pro模型的专属System Instructions,这一突破性举措标志着大模型可靠性发展进入全新阶段,从传统的"黑箱调参"模式成功迈向"工程化指令"时代。官方在Agentic基准套件(涵盖WebArena、ToolBench、MobileBench三大测试模块)的严格验证中,Gemini3Pro的平均...
09:20
今年8月,Matthew和Maria Raine夫妇因16岁儿子Adam的自杀悲剧,将OpenAI及其CEO Sam Altman告上法庭。他们指控这家人工智能公司应对此事件负责,理由是Adam在使用ChatGPT期间获得了关于自杀的指导。对此,OpenAI近日发布法律声明坚决否认指控,强调公司不应为这起令人痛心的悲剧承担任何责任。 OpenAI在声明中透露...