最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年03月14日

22:56
微新创想:2026年3月14日,微软向全球稳定版用户推送了Microsoft Edge 146的更新版本。此次更新带来了多项重要的功能调整与安全优化。 本次更新取消了自定义主密码功能,改用系统级身份验证方式。这一改变旨在提升账户安全,防止用户因误操作或恶意软件导致主密码泄露。 同时,密码不再出现在数据清除选项中,避免了用户在清理浏览数据时误删重要信息。微软此...
22:56
微新创想:联想中国正式推出AI服务“想帮帮”的OpenClaw免费部署服务 3月16日起,联想中国正式推出AI服务“想帮帮”的OpenClaw免费部署服务 用户可线上一键完成下载、安装与配置 或自3月15日21时起通过联想服务小程序预约全国2000+门店线下安装 每日限1000名 部署后即享51个内置Skills 覆盖聊天 编程辅助 图像生成 语音转写等功能...
22:06
微新创想:2026年3月14日 电影《镖人:风起大漠》官宣全版本延长放映至4月16日 该片于2月17日(大年初一)正式上映 由袁和平执导 吴京 谢霆锋 于适主演 累计票房达13.37亿元 登顶中国影史武侠片票房榜首 影片以大漠为背景 讲述镖人刀马护送神秘人物知世郎赴长安途中 卷入多方势力博弈的故事 目前豆瓣评分7.5分 延长放映旨在满足观众观影需求 巩固春节...
22:06
微新创想:3月12日,博主@体验more透露,iQOO Z11x国行版本将于本月正式发布。该机已率先在印度上市,支持NFC功能。新机配备6.76英寸120Hz LCD屏,带来流畅的视觉体验和出色的触控响应。屏幕尺寸适中,适合日常使用和娱乐需求。 新机搭载天玑7400 Turbo处理器,性能表现值得期待。该处理器在中端市场中具有较强的竞争力,能够满足大多数用户...
22:06
微新创想:3月13日,工信部发布第405批《道路机动车辆生产企业及产品公告》公示,北京越野中大型增程SUV享野700完成新车申报 该车为BJ60改款,整体尺寸达到5040×1959×1926(2164)mm,轴距为2820mm,展现出宽敞的内部空间和良好的通过性 配备外挂备胎、拖挂资质及激光雷达,进一步提升了车辆的实用性和智能化水平,满足多种复杂路况下的使用...
22:06
微新创想:3月14日,山西境内晋煤外运重载通道瓦日铁路全面启动为期17天的春季集中修工作。此次施工由国铁太原局组织实施,是为恢复春运后的线路设备状态,确保夏季高峰期间能源运输的安全与稳定。 春季集中修是铁路系统每年例行的重要维护任务。通过集中时间、集中力量对线路进行全面检修,可以有效提升线路运行的安全性和可靠性。瓦日铁路作为山西煤炭外运的重要通道,承担着大量...
22:06
微新创想:2026年3月14日,腾讯宣布企业微信正式支持一键扫码接入OpenClaw智能体开发平台。这一举措标志着企业用户在使用AI智能体的过程中,能够更加便捷地完成平台连接。 用户只需登录腾讯云后台,选择「快捷配置」并点击「前往授权」,随后通过企业微信扫码即可快速创建智能机器人。这种操作方式极大地简化了企业接入AI智能体的流程,有效降低了技术门槛。 此次功...
22:06
微新创想:360集团于3月14日在北京正式发布“360安全龙虾”智能体应用客户端及配套硬件“360安全龙虾Box”同步推出专防OpenClaw漏洞的“龙虾卫士”产品。此次发布的智能体应用客户端集成了多项先进的AI模型技术,能够有效提升企业在网络安全领域的防护能力。该智能体已成功接入国内16家主流大模型,实现了多模型协同工作的强大功能。 在传统安全防护模式下,...
22:06
微新创想:近期开源AI框架OpenClaw凭借其强大的自动化能力迅速受到关注。许多网友将其部署过程戏称为“养虾”,形象地表达了该框架在运行过程中需要一定耐心和技巧。然而,由于手动配置环境的复杂性,普通用户在使用上仍面临一定门槛,难以轻松上手。 为帮助更多用户体验OpenClaw带来的便捷与高效,联想AI服务想帮帮宣布,自3月16日起正式推出OpenClaw免...
22:06
微新创想:千问AI眼镜于AWE2026期间完成国内首次产品发布 这款硬核智能穿戴设备不仅搭载多项旗舰配置还将迎来功能重磅升级 本月底正式上线AI办事功能让用户无需掏出手机就能通过语音指令完成各类生活服务操作 阿里巴巴千问相关负责人介绍千问AI眼镜G1搭载双芯片双系统64GB超大本地存储可轻松保存各类拍摄录音文件 右镜腿创新采用热插拔换电设计从根本上解决智能眼...
22:06
微新创想 3月14日,小米集团创始人雷军在北京小米汽车工厂与刚从德国归来的小米汽车工业设计总经理李田原相遇。两人一同拍摄短视频,向公众展示了新一代SU7的全新配色——靛石绿。在视频中,他们特别提到这款配色在阴天光线下的视觉效果偏黑色,整体风格低调内敛,展现出独特的个性魅力。 靛石绿作为新一代SU7新增的特色配色之一,成为其9款配色中的亮点。目前,新一代S...
21:02
微新创想:2026年3月14日,谷歌在GDC演讲中披露了其AI项目Genie 3的最新进展。Genie 3具备根据文本实时生成3D互动环境的能力,但其稳定性仍存在明显不足。目前的版本只能维持大约一分钟的画面一致性,之后环境开始出现混乱和失序的现象。 Genie 3的生成方式不同于传统的3D引擎架构,它采用的是逐帧视频流式生成技术。这种方式虽然能够实现动态内容...