最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2025年12月15日

09:06
近日,四川四姑娘山双桥沟景区内上演了一幕令人惊叹的自然奇观,一只小鸟的潜水捕鱼场景被游客意外捕捉并上传至网络,迅速在各大平台引发病毒式传播,累计吸引超过300万网友的关注与热议。这段时长仅数秒的视频中,一只棕白色的精灵在冰面上轻盈跳跃,随后以一个精准无比的猛子扎入水中,展现出令人瞠目的游泳与捕食能力。它迅速潜入水底锁定猎物,捕获后悠然游回水面,整个过程流畅而...
09:06
杭州市育才大城北学校近日推出的一项创新奖励政策,在网络上迅速走红,引发了社会各界的广泛关注。与传统教育体系中常见的纸质奖状不同,该校在期中检测结束后,为表现优异的学生们准备了一份别出心裁的奖励——将学生的专属名字印制在实用物品上,包括定制被子、毛毯、枕头和毛巾等,让学生们能够"睡在奖状堆里"。这一充满创意的奖励方式不仅获得了学生们的热烈欢迎,也赢得了众多家长...
09:06
微新创想12月15日重磅报道,备受瞩目的华为Mate 80系列终于迎来鸿蒙HarmonyOS 6.0.0.120 SP9版本的正式推送,这一消息迅速点燃了科技爱好者的热情。值得注意的是,该版本此前曾因界面显示存在Bug而紧急撤回,经过华为团队的细致修复与优化,终于以更完善的姿态与用户见面。 本次更新不仅解决了原有问题,更在多个维度上实现了显著提升。相机功能方...
09:06
微新创想12月14日讯 OpenAI首席执行官Sam Altman近期多次释放信号暗示ChatGPT将涉足成人内容领域,如今这一功能的推出时间表终于有了明确进展。OpenAI应用负责人Fidji Simo在近日举办的GPT-5.2模型发布会上透露,她预计ChatGPT的成人模式将在2026年第一季度正式上线。 Simo特别强调,在推出这项备受争议的新功能前,...
09:06
微新创想12月14日讯 据TechCrunch报道 谷歌近日推出了一项令人瞩目的测试版功能 让用户能够通过耳机实时收听翻译内容 这一创新举措不仅提升了跨语言沟通的便捷性 谷歌还将备受期待的Gemini高级模型成功集成至谷歌翻译应用 进一步强化了其语言学习工具的实用性 全新的实时耳机翻译功能堪称突破性进展 它能够完整保留说话者的语气重音和语调变化 帮助用户...
09:05
微新创想12月14日重磅消息,日本LINE与Yahoo联合发布的最新AI使用调查报告揭示了日本年轻群体对人工智能技术的惊人接纳度与多样化应用场景。这项针对15至24岁青少年的深度调研显示,AI已深度融入日本年轻人的日常生活,成为他们获取知识、解决问题和娱乐休闲的重要工具。 调查数据显示,日本年轻人在使用AI时展现出多元化的需求偏好。其中,36.1%的受访者将...
08:57
OpenAI 应用主管 Fidji Simo 近期在一场备受瞩目的 GPT-5.2 模型发布会上,首次正式透露了 ChatGPT "成人模式" 的上线时间表。据 Simo 介绍,这一备受期待的功能预计将在 2026 年第一季度与用户见面,为全球 ChatGPT 用户提供更加开放多元的内容体验。然而,在迈向这一里程碑的过程中,OpenAI 面临着两大核心挑战:...
08:35
近日,网络上掀起了一股关于“一碗木薯糖水为何能让人‘迷昏’”的热议浪潮。许多网友纷纷分享自己食用木薯糖水后出现的头晕、乏力等不适症状,这一现象不仅引发了广泛关注,更让这一传统甜品的安全性受到了前所未有的质疑。 木薯作为一种常见的食材,其本身含有一定量的氰化物,这是一种对人体有害的毒素。如果木薯未经充分处理或食用过量,都可能导致中毒事件的发生。在制作木薯糖水的...
08:27
2025年5月13日起,微软开始在部分iOS应用(如OneDrive)的更新日志末尾添加特殊标注"本更新说明由Copilot生成"。这一创新举措并非源于苹果公司的强制要求,而是微软主动采取的策略,疑似旨在借助高曝光的应用更新场景,有效推广其前沿AI助手Copilot。值得注意的是,这类标注主要出现在内容较为丰富、影响范围较大的重大版本更新中,而对于小型修复性...
08:27
2025年12月,我国自主研发的新型高空长航时无人机彩虹-7成功完成首飞,标志着我国在无人机领域取得重大突破。这款无人机翼展超过27米,采用先进的气动设计、隐身技术和智能控制系统,能够在高空亚音速环境下稳定飞行。彩虹-7具备强大的任务执行能力,可在高对抗环境下执行侦察、情报获取任务,并为远程打击提供精准的目标指示,是我国国防力量现代化的重要装备。 此前,彩虹...
08:27
2025年12月15日凌晨,全球电竞舞台再掀波澜,Team Vitality在《反恐精英2》(CS2)布达佩斯Major决赛中以3:1的比分力克FaZe Clan,成功卫冕这一电竞界的最高荣誉。继今年上半年在BLAST.tv奥斯汀站夺冠后,Vitality再次证明了自己的统治力,将Major冠军奖杯收入囊中,书写新的传奇篇章。 在这场激动人心的决赛中,Vit...
08:27
2025年12月15日,光伏行业迎来重大突破天合光能宣布其研发的大面积钙钛矿/晶体硅叠层电池转换效率高达32.6%,这一成果不仅刷新了同尺寸电池的世界纪录,更标志着下一代高效光伏技术迈入新纪元。该技术突破由天合光能光伏科学与技术全国重点实验室与怀柔实验室联合攻关完成,其严谨性和可靠性已获得德国Fraunhofer ISE CalLab权威认证。更令人瞩目的是...