最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年02月13日

09:09
微新创想:2026年2月7日,苹果机器学习研究团队发布论文《绘制计算机操作智能体用户体验设计空间》。该研究通过分析9款主流AI智能体,并结合20名用户参与的‘绿野仙踪’实验,系统梳理出‘用户指令’‘活动可解释性’‘用户控制’和‘心智模型’四大设计维度。 研究结果显示,用户在与AI智能体交互时非常重视透明度与可控性的平衡。在执行探索性任务时,用户希望看到智能体...
09:09
微新创想:深圳第零智能科技股份有限公司于2025年2月10日向港交所主板提交了上市申请。作为一家专注于企业级AI智能体解决方案的科技企业,公司自2020年8月成立以来,迅速在行业内崭露头角。2024年,第零智能在国内企业级AI智能体市场中位列第五,市场占有率达到了3.0%。 微新创想:公司核心技术平台BlackZero成功融合了大模型与领域小模型,为客户提供...
09:09
微新创想:2026年2月,天马微电子旗下厦门新型显示技术研究院成功点亮12英寸Micro LED高亮车载显示屏。该屏专为全景HUD系统设计,亮度超50,000nits,对比度达1,000,000:1,色域覆盖NTSC 110%。其出色的显示性能不仅提升了视觉体验,也为车载显示技术带来了新的突破。 微新创想:采用无背光自发光架构,结合新型TFT驱动、优化LED...
09:09
微新创想:2026年2月13日,索尼State of Play发布会上,卡普空正式公开了《生化危机:安魂曲》的终极预告。这款游戏定于2月27日全球发行,标志着生化危机系列迎来了又一重要里程碑。 预告片中,主角里昂·S·肯尼迪被确认感染了T病毒。他的手臂呈现出灰败的状态,颈部也出现了明显的黑斑,展现出病毒带来的严重变异。里昂正与时间赛跑,努力寻找解药,以阻止病...
09:09
微新创想:近日,微博话题“杭州 9 岁男孩拍短剧 1 天赚 2000 元”冲上热搜榜,引发公众对儿童演员及微短剧行业的广泛关注。该话题迅速成为讨论热点,不仅展现了微短剧行业的快速发展,也引发了关于未成年人参与商业活动的思考。 据媒体报道,浙江籍童星李星澄已参与拍摄近 200 支广告及 10 余部微短剧作品,并与林更新等知名演员有过合作。他的成功并非偶然,而是...
09:09
微新创想:人工智能领域的领头羊Anthropic于本周四正式宣布公司已成功募集300亿美元的G轮融资。凭借这笔巨额注资,该公司的估值已飙升至3800亿美元,相较于上一轮(F轮)融资时的1830亿美元,实现了翻倍增长。此次融资不仅彰显了市场对其技术实力的认可,也为其未来的发展注入了强大动力。 顶级资本加持本轮融资由新加坡主权财富基金GIC与投资巨头Coatue...
09:09
微新创想:针对此前彭博社关于“Siri 新功能推迟发布”的报道以及随后引发的股价波动 苹果公司正式向 CNBC 发表声明 明确重申 新版 Siri 仍按既定计划在 2026 年内推出 此前有消息称 苹果在推进更智能 更具个性化的 Siri 落地过程中遭遇技术挑战 导致部分原定于 iOS 26.4 上线的功能可能推迟至 5 月的 iOS 26.5 甚至 9 月...
09:09
微新创想:针对彭博社披露的新版 Siri 功能跳票消息及由此引发的股价动荡 苹果公司今日通过 CNBC 发表紧急声明 确认更智能 更个性化的新版 Siri 仍将按原计划于2026年内正式推出 市场动荡 传闻引发股价 大跳水 此前彭博社消息 苹果在推进 Siri 的深度智能化过程中遭遇落地挑战 部分关键功能疑似从 iOS26.4 延期至5月的 iOS26.5 ...
09:09
微新创想:为了在算力战场上掌握更多主动权 OpenAI正加速推行其“去英伟达化”战略。2026年2月12日 OpenAI正式发布了首款基于Cerebras Systems芯片的AI模型——GPT-5.3-Codex-Spark。这款模型的推出标志着OpenAI在算力自主化道路上迈出了重要一步。 编程体验的“闪电”进化作为一款专为软件工程师打造的生产力工具 G...
09:09
微新创想:当多数科技巨头正因人工智能的冲击而缩减初级岗位时,IBM 却选择了一条截然相反的道路。全力加码入门级人才,成为这家科技巨头在人工智能浪潮中的独特战略。在昨日由 Charter 举办的“引领人工智能峰会”上,IBM 首席人力资源官尼克尔·拉莫罗克斯宣布,IBM 计划在 2026 年将其在美国的入门级招聘人数增加两倍。这一举措直接挑战了“AI 将掏空初...
09:09
微新创想:在经历了一场导致多名高管离职的大规模重组后,埃隆·马斯克昨日为其人工智能公司 xAI 勾勒出了一个惊世骇俗的未来蓝图。月球基地将成为人工智能进军深空的“补给站”。马斯克明确表示,xAI 与 SpaceX 合并并计划上市后,招聘重心已从传统的通用人工智能(AGI)研发转向了更宏大的航天工程。他向潜在求职者抛出橄榄枝:“如果你对月球上的大规模自动驾驶汽...
09:09
微新创想:曾经坚称“广告是商业模式最后手段”的山姆·奥特曼(Sam Altman),最终还是向现实低了头。2026年2月13日,据格隆汇报道,OpenAI已于本周正式在旗下的旗舰产品 ChatGPT 中上线广告业务。 昔日诺言VS今日现实:两年前,奥特曼在哈佛大学演讲时曾明确表示,他非常反感在聊天机器人中插入付费广告,认为这会破坏用户对产品的信任。然而,随着...