最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年01月26日

04:17
1月26日,美国东部时间14时14分,一场罕见的全国性大停电席卷美国,累计报告停电次数高达1,005,641次。此次事件波及范围极广,横跨多个州域,具体受影响区域及事故原因尚未公布。面对突发状况,电力运营商已启动紧急排查机制,部分区域更同步启动了应急响应预案。根据初步分析,此次大规模停电可能与冬季极端天气及电网负荷过高存在直接关联。值得庆幸的是,截至目前,尚...
00:42
2026年1月25日,香港将正式推行一项具有里程碑意义的新道路交通安全规定,旨在全面提升城市交通安全水平。根据新规要求,所有公共交通工具及商用车辆的每一位乘客,无论坐在哪个座位,都必须系好安全带。这一新措施将全面覆盖全港范围,包括但不限于巴士、小巴、出租车以及各类货车等商用车辆。 值得注意的是,新规的适用范围极为广泛,不仅要求乘客主动佩戴安全带,同时也将车主...

2026年01月25日

23:40
1月25日,任天堂直面会发布《超级马力欧银河大电影》全新预告。影片定于4月1日全球首映,由Illumination制作,目前动画已全部完成,进入音效与配乐后期阶段。预告首次正式亮相耀西与凯瑟琳,展现马力欧兄弟与耀西的相遇及合作;另含凯瑟琳与碧琪公主短暂打斗镜头,并确认库巴二世、罗洁塔等新角色加盟。婴儿马力欧与路易吉形象亦现身,身份尚不明确。
23:40
smart品牌正式官宣,旗下备受瞩目的精灵#2原型概念车将于2026年4月亮相北京国际车展,实现全球首发。这款极具未来感的车型由梅赛德斯-奔驰顶尖设计团队倾力打造,其核心技术平台基于全新ECA超紧凑纯电架构开发,展现出极致的空间利用率和前瞻性设计理念。作为smart品牌首款双门双座车型,精灵#2原型车将重新定义微型纯电车的审美与实用标准。 据悉,精灵#2原型...
23:10
2026年1月,Newsguard发布的一项权威测试报告揭示了AI模型在识别伪造视频方面的严峻挑战。测试结果显示,Grok、ChatGPT和Gemini这三款主流AI模型对Sora生成的虚假视频识别错误率分别高达95%、92.5%和78%。这一数据令人震惊,凸显了当前AI技术在对抗深度伪造技术方面的不足。 研究团队使用了20条经过精心去水印处理的虚假视频作为...
23:10
2026年1月24日,备受瞩目的2026北京国际商业航天论坛隆重召开。银河航天创始人、董事长兼CEO徐鸣在会上发表了极具前瞻性的主旨演讲,为与会者描绘了太空产业的宏伟蓝图。徐鸣指出,太空新基建正迎来前所未有的发展机遇,即将开启一个规模高达万亿级的产业爆发期。根据他的预测,到2035年,全球太空经济的整体规模有望突破1.8万亿美元大关,展现出巨大的发展潜力。 ...
23:10
2026年2月下旬,科技界将迎来一项重大变革——苹果计划在iOS 26.4测试版中推出基于谷歌Gemini模型的全新Siri。这一创新功能将由代号"苹果基础模型v10"驱动,该模型拥有高达1.2万亿的参数量,展现出强大的智能处理能力。值得注意的是,该模型将运行于苹果自建的私有云平台上,确保用户数据的安全与隐私。 此次合作源于苹果在自研AI模型方面进展缓慢,此...
23:10
2026年,中国航天领域将迎来一项重大突破——星河动力自主研发的智神星二号可重复使用液体运载火箭计划正式启航。这一消息由星河动力总工程师李君在2026北京国际商业航天论坛上郑重宣布,标志着我国在可重复使用运载火箭技术领域迈出了关键性步伐。 智神星二号火箭在设计上展现出卓越的灵活性与高效性,其直径达到4.5米,并配备了两种构型以满足不同任务需求。基本型构型的L...
22:49
微新创想1月25日即时报道 近期,一则关于"女子用洗衣机清洗羽绒服引发爆炸"的新闻迅速引爆网络,引发社会广泛关注。这一事件再次提醒我们,羽绒服清洗看似简单,实则暗藏安全风险。 专家指出,此类危险事件主要发生在使用老式波轮洗衣机(尤其是双缸式)进行羽绒服甩干时。由于羽绒在遇水后会迅速结团,而羽绒服面料大多具有防水性和较差的透气性,当洗衣机内筒高速旋转时,会持...
22:10
2026年1月26日12:00,备受瞩目的CHERRY樱桃《宝可梦》IP联名百变怪主题外设正式开启预售。此次合作将经典游戏元素与高端外设设计完美融合,推出MX 8.2 Pro Hybrid键盘与桌垫型鼠标垫两款明星产品,为全球玩家带来前所未有的游戏体验。 MX 8.2 Pro Hybrid键盘采用创新的双轴设计,主键区支持机械轴与磁轴自由互换。出厂默认配置W...
22:10
2026年1月25日,上海正式将人工智能训练师纳入急需紧缺高技能人才目录,彰显了该职业在推动城市数字化转型中的关键作用。这一职业自2020年2月被正式纳入国家职业分类大典以来,已建立起从五级到一级的完整技能等级体系,共设五个层级,为从业者提供清晰的职业发展路径。据悉,该职业培训以实践操作为核心,实操课程占比高达70%,确保学员能够快速掌握核心技能。培训课程特...
22:10
1月26日至3月12日,百度文心助手将在百度APP上线春节现金红包活动,用户使用该AI助手即可参与瓜分5亿元红包,单人最高可得1万元。活动由百度主办,覆盖全国范围,旨在推动AI产品在节日期间的大众化应用。同期,百度APP作为首席AI合作伙伴,将深度参与《2026北京广播电视台春节联欢晚会》。此举标志着百度正式加入2026年春节AI应用竞争赛道。