最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年03月21日

23:20
微新创想:《红色沙漠》于3月20日正式发售,首日便取得了令人瞩目的成绩,全球销量突破200万份。这款游戏迅速吸引了大量玩家的关注,成为近期游戏市场的一匹黑马。 截至3月21日发稿时,距离发售仅约36小时,官方便发布了公告向玩家致谢。同时,也坦诚地承认游戏在键盘和鼠标操作方面存在一定的不便,并表示正在紧急开发更新补丁以改善体验。 《红色沙漠》登陆了PC、Mac...
23:20
微新创想:广汽埃安将于3月25日在全国范围内启动全新车型AION N60的盲订活动。这款车型定位为五座中型纯电轿车,凭借其出色的尺寸设计,整体长宽高达到4615×1860/1883×1673mm,轴距长达2775mm,为驾乘者提供宽敞舒适的内部空间。 微新创想:AION N60由前宝马设计师Benoit Jacob主导设计,外观与内饰均展现出高端科技感与时尚...
22:49
微新创想:3月20日晚,重庆大学某实验室发生爆炸事故,造成1名学生死亡、3名学生受伤。事发地位于重庆市沙坪坝区重庆大学校区内,伤者已送医救治,生命体征平稳。相关部门已介入调查,初步排除人为故意因素,具体原因正在技术勘验中。校方已启动应急响应,全面排查实验室安全隐患。此次事故引发了社会对高校实验室安全管理的广泛关注。高校作为科研和技术发展的前沿阵地,实验室安全...
22:49
微新创想:2026年3月21日,微信官方面向iOS用户推送8.0.70正式版更新 本次更新主要修复若干已知问题,未公布具体功能调整 更新覆盖中国大陆地区所有兼容机型,用户可通过App Store获取 IT之家同步提供最新内部版下载指引,但官方未披露新增特性细节 建议用户及时更新以获得稳定性提升
22:18
微新创想:3月21日是世界睡眠日,2025年中国主题为“优质睡眠,美好生活”。这一全球性关注睡眠健康的节日,旨在提高公众对睡眠质量重要性的认识,倡导科学作息,改善睡眠环境,从而提升整体生活质量。 《2025年中国睡眠健康调查报告》数据显示,18岁及以上人群中,超过48%的人存在睡眠困扰。这一比例反映出当前社会普遍存在的睡眠问题,尤其是在工作压力、生活节奏加快...
22:18
微新创想:3月19日,极星汽车在瑞典哥德堡总部召开媒体会,CEO迈克尔·洛施勒明确表示,公司坚持纯电动路线,不研发混动或燃油车型。此举基于其用户结构——平均年龄45岁,较行业年轻10岁,高度认同环保与科技。洛施勒强调,客户对零排放的坚定诉求是战略根基。 未来产品按计划推进:Polestar 5 GT、Polestar 4旅行版、2027款全新Polestar...
21:46
微新创想:3月21日20时16分,中大西洋海岭北部发生6.7级地震。地震的震中位于北纬23.75度、西经45.75度。此次地震的震源深度为10千米,属于浅源构造地震。地震的发生与板块扩张活动密切相关,是地球内部构造运动的一种表现形式。 此次地震发生于远离陆地的洋中脊区域,因此对周边沿海地区的影响相对较小。目前尚未有沿岸国家发布相关的灾情信息。地震发生后,相关...
21:46
微新创想:3月21日 万兴科技宣布旗下万兴图示和万兴脑图的部分Skills正式登陆海外OpenClaw平台ClawHub 这一消息引起了广泛关注 此次上线的Skills支持自然语言调用 用户无需复杂操作即可实现高效办公与学习 为日常任务处理提供了极大的便利性 万兴图示作为国内首个接入OpenClaw生态的图示类软件 在国际市场上展现出了强大的竞争力 万兴脑图...
21:13
微新创想:OpenAI计划在2026年底前将员工数量从4500人增加至8000人,重点扩展产品开发、工程、研究和销售团队。同时公司还将新增‘技术大使’这一职位,专门负责协助企业客户更好地应用和落地AI工具。这一扩张计划的背后是公司刚刚获得的1100亿美元融资,使得其估值攀升至8400亿美元。为了支持这一增长,OpenAI已经开始进行内部资源的重新配置,去年1...
20:39
微新创想:2026年3月20日,微软Windows与设备执行副总裁Pavan Davuluri向Windows Insider成员发布公开信,宣布将围绕性能、可靠性与体验打磨三大方向优化Windows 11。多项改进将于3月、4月预览版中陆续上线,重点解决系统卡顿、更新不稳定及广告干扰等问题。 微软副总裁Scott Hanselman承认该设计“令人反感”,...
20:39
微新创想:3月21日,上海发布《Dongbi Index全球高质量期刊列表》医学与生命科学分册。该列表由东壁科技数据联合中国医学科学院医学信息研究所、上海交通大学医学院图书馆共同研制。从全球超过4万种期刊中,精心遴选了4027种医学和3064种生命科学领域的优质期刊。 微新创想:此次发布的期刊列表依据原创引文追溯与网络层级分级方法,对期刊进行科学分类,按A-...
20:39
微新创想:2026年3月21日,X平台用户发现“Grok Computer”即将上线,推测为xAI与特斯拉联合项目“数字擎天柱”(代号“巨硬”)的智能体形态。马斯克当日傍晚转发并确认“即将推出”。该项目由xAI与特斯拉共同开发,Grok作为系统2(决策层)实时指挥“数字擎天柱”执行屏幕、键盘、鼠标级操作,聚焦企业自动化与公司级模拟。未来或与Optimus机器...