最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年01月09日

10:28
2025年,即时零售的“东风”依旧猛烈,市场规模逼近万亿大关,“餐饮+非餐”品类单量均刷新了历史纪录,验证即时零售的天花板远未见顶;另一方面,零售供给侧的变革,引发新一轮“外卖大战”,如何充分链接平台、商家和消费者,寻找实现多赢的平衡点,成为即时配送行业贯穿全年的核心主题。也是在这一年,顺丰同城作为行业内稀缺的全场景第三方即配平...
10:28
微新创想1月9日消息,根据苹果文件披露,公司CEO蒂姆库克2025年总薪酬为7430万美元,约合5.2亿元人民币。除了薪酬之外,苹果文件中还包含一份库克致苹果股东的感谢信。库克在信中表示:我未来从未如此乐观。他回顾了苹果过去一年的成绩,其中iPhone 17 Pro系列、AirPods Pro 3、iPad Pro、MacBoo...
10:28
微新创想1月9日消息,据媒体报道,有网友日前发文称,在二手交易平台闲鱼上出现了提供上海地铁代坐”服务的帖子,随即引发网络热议。据网友晒出的截图,其中一项标价1.99元的服务,可代占上海地铁9号线某特定路段的座位。类似帖子多集中在2、9、10、13、18号线等线路,发帖者大多自称从起点站附近上车,并承诺让座”给买家。一位自称上班顺...
10:16
2026年1月8日,任天堂宣布新作《马力欧网球狂热》将于2月12日独占登陆Nintendo Switch 2。游戏首发收录38名可玩角色,为系列之最,并引入含30种特殊能力的“狂热球拍”机制,通过积累能量释放干扰技能。同时提供“经典模式”还原纯粹竞技,另有受《惊奇》启发的场地变化模式及冒险、在线多人等玩法,满足多样化需求。
10:16
2026年1月9日,润建股份正式对外宣布与京东科技达成战略合作,双方签署了《战略合作框架协议》,标志着两家企业在人工智能领域的深度合作迈入新阶段。根据协议内容,双方将重点聚焦AI应用创新、智算云平台拓展以及智算AIDC等前沿领域,共同推动人工智能技术的商业化落地进程。此次合作的核心目标在于整合双方优势资源,显著提升技术创新能力,并积极探索智能化场景在各个行业...
10:16
2026年1月9日,技嘉科技在CES 2026发布CQDIMM技术。该技术通过Z890 AORUS TACHYON ICE CQDIMM Edition主板与BIOS优化,实现两条128GB内存满载运行,总容量达256GB,频率高达DDR5-7200,创下业界新纪录。此举解决了高容量与高频率内存难以兼顾的技术难题,为高性能计算提供更强支持。
10:16
2026年1月,揽能新能源宣布完成800万元天使轮融资。揽能新能源是一家专注于别墅户用及工商业场景的分布式能源综合解决方案提供商,主营业务覆盖光伏发电与储能系统的研发、定制化设计及一体化建设。本轮融资资金将用于核心技术迭代、高端人才引进及华东区域市场的深度拓展。此举旨在强化公司在清洁能源领域的技术优势与市场布局,提升综合竞争力,推动绿色能源应用的普及。
10:16
2026年11月,首届电子竞技国家杯(ENC)将在沙特利雅得举行。赛事由EWCF基金会主办,为期四周,设16个游戏项目,每项持续一周。与EWC不同,ENC选手将代表国家参赛,每个国家每项目限派1支队伍或2名选手。参赛名额半数通过预选产生,半数为直邀。赛事此后将每两年在全球轮办一次。
10:16
2026年1月8日,在CES 2026展会上,雷克沙推出THOR Z RGB DDR5内存套件。该产品定位“基准性能”市场,提供32GB(2x16GB)容量,支持6000 MT/s频率,配备Intel XMP 3.0与AMD EXPO技术,可实现一键超频。内存提供两种时序版本,分别为CL36-40-40-96/1.4V和CL38-48-48-96/1.35...
10:16
2026年1月9日,东南亚网约车平台Grab与广汽国际宣布达成战略合作伙伴关系。双方计划在未来两年内,向东南亚六国投放20,000台广汽高性能电动汽车,推动区域绿色出行发展。首批车型将包括广汽埃安Y、埃安S和埃安V三款主力电动车型,丰富Grab平台的车辆供给。此次合作旨在提升电动车在共享出行领域的渗透率,加速东南亚交通可持续化进程。
10:16
2026年1月9日,数码圈传来重磅消息,知名数码博主@数码闲聊站率先披露了一加即将发布的新机信息。这款备受期待的机型代号为D9500,预计将搭载旗舰级配置,正式亮相后有望成为市场焦点。 据悉,D9500将采用一块6.78英寸的LTPS直屏,采用先进的1.5K分辨率显示技术,配合165Hz的高刷新率,带来极致流畅的视觉体验。屏幕不仅支持高分辨率显示,更具备出色...
10:16
2026年1月8日,多家媒体证实,《巫师3:狂猎》或将推出第三个大型DLC,预计于2026年5月发布,恰逢游戏发售11周年。新DLC可能以沙漠地区“瑟瑞卡尼亚”为舞台,亦或引入科维尔和波维斯,形成视觉与剧情的新突破。消息显示,DLC或由Fool's Theory等外部团队主导开发,CDPR仅少量人员参与。此举旨在平衡新作开发与经典内容更新,满足玩家期待。