最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年03月12日

15:13
微新创想:3月10日,美国汽车媒体Car and Driver对2026款保时捷911 Turbo S混动版进行了实测。在普通高抓地力路面上,该车型完成0-60英里/小时(约合97公里/小时)加速仅需2.0秒,其中包括1英尺起步位的短暂延迟。测试过程中采用了VBOX数据记录仪与GLONASS/GPS高精度定位系统,以确保数据的准确性和可靠性,并取双向平均值作...
15:13
微新创想:2026年3月12日,深圳铭凡科技正式发布基于英特尔Panther Lake平台的全新AI迷你主机M2 Pro。这款产品专为追求高性能与高效能比的用户设计,搭载了英特尔酷睿Ultra X9 388H处理器,为AI计算提供了坚实的基础。同时,该主机支持高达9600MHz的高频内存,确保在处理复杂任务时依然保持流畅运行。 微新创想:M2 Pro还配备了...
15:13
微新创想:2026年3月12日,投行Oppenheimer发布报告指出,无人机及自主系统正驱动军事与商业场景深度变革 报告预测,未来十年全球无人机相关市场规模将从当前450亿美元增至约4000亿美元 增长主要来自低空、海洋、地面(占约50%)及高空、卫星领域(占另50%) 无人机被视为‘实体AI’中增速最快的赛道 其规模化部署正加速改变作战范式与产业格局
15:13
微新创想:3月12日,OPPO官方发布OPPO Watch X3的核心配置信息。该表采用航天级钛合金材质,重量减轻16%、厚度减薄6.4%,在轻薄与坚固之间实现了完美平衡。配备蓝宝石屏幕与3000尼特峰值亮度,带来更加清晰细腻的视觉体验。 支持ECG、腕温、血氧等多维健康监测功能,能够全面掌握用户的健康状况。特别引入无感高血压风险评估、60秒AI体检、睡眠健...
15:13
微新创想:3月10日,美国加州大学洛杉矶分校IPAM研究所举办了一场关于人工智能在数学科研中应用的专题对话。OpenAI的高管Mark Chen与著名数学家、菲尔兹奖得主陶哲轩共同参与,深入探讨了AI如何改变数学研究的现状与未来。 AI在数学领域的表现令人瞩目,已经从最初的‘低效研究生’角色,逐步发展为能够获得国际数学奥林匹克(IMO)金牌的水平。这一转变不...
15:13
微新创想:2026年3月12日,微信鸿蒙版发布8.0.15.64正式版更新,官方称主要修复若干已知问题。该版本已在华为应用市场等渠道推送,截至当日安装量突破4600万次。更新面向搭载HarmonyOS的设备用户,无需内测资格即可升级。此次迭代未新增功能,聚焦稳定性与兼容性优化。用户可通过IT之家公众号回复“微信”获取最新内部版下载方式。
15:13
微新创想:敦煌网于3月12日正式推出“AI客服助手”这一全新功能,专为平台卖家打造,旨在提供更高效、更及时的客户服务体验。该工具能够自动处理买家常见的咨询问题,例如商品实物图、发货时间及物流状态等,有效覆盖深夜时段,这一时段正是欧美买家最为活跃的时期。 微新创想:通过引入AI客服助手,敦煌网希望解决跨境贸易中因时差问题带来的回复延迟,从而改善买家的整体购物体...
15:13
微新创想:2026年3月12日,英国Wayve、美国Uber与日本日产汽车正式签署谅解备忘录,拟于2026年底前在东京启动自动驾驶出租车服务。这一合作标志着自动驾驶技术在实际应用中的重要一步。 项目将采用搭载Wayve AI Driver系统的日产LEAF聆风电动车,通过Uber平台进行运营。Wayve的AI Driver系统是其自主研发的自动驾驶解决方案,...
15:13
微新创想:3月11日傍晚,在张家界市永定区的交通繁忙时段,发生了一起惊心动魄的救援事件。一名辅警吴胜泽在街头执勤时,突然发现一辆公交车尾部有一名背着书包的女学生大半个身体倒挂在车窗外,情况万分危急。 据目击者称,当时小女孩头部朝下,只有两只脚勾着窗沿,随时都有可能掉下来。就在这千钧一发之际,辅警吴胜泽毫不犹豫地丢下电动车,一边大喊“停车!”,一边飞奔向公交车...
15:13
微新创想:近日,一位女士遭遇了一件令人不安的事情——她并未下单任何商品,却收到了一个匿名快递。打开包裹后,里面竟是一块充电宝。这一事件迅速在网络上传开,引发广泛关注和讨论。许多网友纷纷提醒她“千万别用”,认为这可能是某种新型诈骗手段。 这类被网友称为“毒充电宝”的设备,虽然外观与普通移动电源相似,但其内部却隐藏着严重的安全隐患。不法分子通过改装充电宝,将其变...
15:13
微新创想:3月11日,全国人大代表、格力电器董事长董明珠就企业加班文化、年轻人消费行为、企业创新及农村养老保障等话题发表了自己的看法,其中关于反对无效加班的言论引发广泛关注。 董明珠直言,在格力电器内部,她明确反对无效加班。我们观察到,很多员工的加班其实是无效的,这样的加班我们坚决不允许。她表示,格力鼓励高效工作,反对为了加班而加班的形式主义。 不过,她也理...
14:43
微新创想:速卖通AliExpress宣布推出“海外托管卖光计划” 该计划专门针对跨境商家设计,为已备货至海外仓的商品提供平台兜底包销的保障服务 首期计划将于本月正式启动 目前仅向1000家商家定向邀约,作为试点运行为期三个月 这一举措的推出旨在帮助商家更高效地完成本地备货转型 通过平台的支持,有效降低商品滞销带来的经营风险 同时,该计划还显著提升...