最新研究揭示GPT-4的创造力已全面超越人类水平

编者按:本文源自微信公众号新智元(ID:AI_era),作者拉燕,经微新创想授权发布。近期一项关于GPT-4创造力思维能力的测试成果引发广泛关注。蒙大拿大学与UM Western大学的研究团队发现,GPT-4在权威的托伦斯创造性思维测试(TTCT)中表现卓越,其得分直接位列前1%。无论是流畅性、灵活性还是原创性等关键指标,GPT-4不仅与人类不相上下,更在多个维度上实现了超越。这项突破性研究在南俄勒冈大学的创意会议上正式发表,标志着人工智能创造力研究迈入新纪元。

GPT-4创造力全面超越人类 最新测试排名前1%插图

研究团队由蒙大拿大学和西澳大学教授领衔,他们通过严谨的实验验证了GPT-4的非凡创造力。在TTCT测试中,GPT-4在流畅性、灵活性和原创性等核心创造性指标上均表现优异,其得分均在前1%区间,充分证明AI已具备与人类匹敌甚至超越人类的能力。这些重要发现在南俄勒冈大学的创意会议上获得学界高度认可。

Guzik博士作为该研究项目的负责人,强调这一成果对初创企业和小型企业的革命性意义。他表示,GPT-4展现出的强大创造力将极大推动创新生态发展,成为驱动整体经济增长的新动能。Guzik进一步指出,传统初创企业常受限于资源不足,难以组建专业团队进行全面市场调研。而GPT-4的出现将彻底改变这一局面,为中小企业提供前所未有的创新支持。

GPT-4创造力全面超越人类 最新测试排名前1%插图1

这项研究的缘起可追溯至2013年。当时,Gilde博士与Guzik博士在Boise州立大学举办的创新与创造力研讨会上相识,三人因对人工智能与创造力交叉领域的研究兴趣结缘。他们共同意识到AI技术对商业教育和企业发展的巨大潜力,并坚信AI将成为商业创新的强大助力。随着ChatGPT等技术的成熟,他们决定深入探索AI的创造力边界。

研究团队采用TTCT的两个标准变体对GPT-4进行了八次全面测试。TTCT作为评估创造力的权威工具,要求被测试者通过提问、分析因果关系、预测潜在后果、提出产品改进方案、构想替代用途以及展望未来场景等方式展示创造性思维。第三方评估机构Scholastic Testing Services对GPT-4的反应与人类样本进行了严格对比,结果令人震撼。

GPT-4创造力全面超越人类 最新测试排名前1%插图2

在流畅性测试中,GPT-4在所有八项任务中均表现突出,其反应数量始终位居人类样本前1%,展现了惊人的发散思维能力。在灵活性测试方面,GPT-4在三项任务中位列前1%,两项居前2%,其余三项也进入前7%,充分证明其能够灵活转换思维视角。而原创性作为衡量创造力的核心指标,GPT-4更是表现惊艳——在全部八项测试中均位列前1%,其产生的独特见解远超人类平均水平。Guzik博士评价道:”这是首个证实AI能产生与人类创造力同等甚至更高原创性成果的研究。”

研究团队预测,未来五年内AI将全面渗透创业与商业的各个环节。从发现市场机会、提出创新解决方案,到产品迭代优化、制定营销策略,乃至未来趋势预测,AI都将发挥关键作用。团队计划在今年夏季发布进一步研究成果,包括如何通过针对性训练提升GPT-4在商业创新和创业领域的创造能力。

GPT-4创造力全面超越人类 最新测试排名前1%插图3

值得注意的是,GPT-4创造力的突破也引发了一些争议。国外研究者Phil Bennett曾警告AI创造力可能”稀释”人类原创力。他认为AI生成的内容本质上是基于已有数据的重组,而非真正意义上的创造。这种”反刍式”生成机制可能使人类陷入思维惰化,导致创新同质化。然而,蒙大拿大学的研究团队认为,AI与人类创造力并非零和博弈,二者结合将催生更强大的创新生态。

参考资料:https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文(含图片)为合作媒体授权微新创想转载,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年01月05日

20:20
2025年12月,特斯拉上海超级工厂的交付量强势突破9.71万台,环比增长11%,不仅刷新了年内交付记录,更展现出其强大的生产动能。当月中国国内市场表现同样亮眼,销量约达9.4万台,同比增长13%,彰显了特斯拉在中国市场的深厚根基与持续增长势头。从全年来看,上海超级工厂交付总量高达85.1万台,这一数字占据了特斯拉全球总交付量的52%,进一步巩固了其作为特斯...
20:20
2026年1月5日,微软正式宣布将在Windows 11系统中推出一项重要更新,旨在优化用户共享体验。根据计划,新版系统将在“共享”功能界面中新增一个关键开关,让用户能够自主选择是否显示应用推荐广告。这一功能此前被称为“就近共享”,经过重新设计后,将正式更名为“智能共享”。用户只需进入“设置 > 系统 > 共享”菜单,就能找到“在共享界面中显示推...
19:48
2026年1月5日,字节跳动旗下豆包AI眼镜的发布传闻再起,引发市场广泛关注。针对“豆包AI眼镜即将出货”的消息,豆包相关负责人明确回应称此消息并不属实,目前尚未制定明确的销售计划。这一澄清表明,尽管外界对豆包AI眼镜充满期待,但产品正式上市仍需时日。 此前,供应链方面曾透露出一些关于豆包AI眼镜的细节。据称,无屏版AI眼镜计划于今年第一季度正式发布,而配备...
19:48
2026年1月5日,微软正式宣布Windows系统自带的Storage Sense和磁盘清理工具已全面升级,足以应对绝大多数用户的日常清理需求,无需再额外安装第三方软件。这一举措旨在简化用户操作,同时提升系统资源管理效率。 Storage Sense作为Windows内置的智能存储管理助手,能够自动识别并删除临时文件、回收站内容以及其他可回收数据,有效释放磁...
19:48
2025年,全球企业正经历一场由激进投资者掀起的公司治理变革浪潮,其力度与规模均创下历史新高。根据巴克莱发布的权威数据,全年范围内针对企业治理的干预行动高达255起,这一数字不仅超越了2018年249起的先前峰值,更标志着投资者对公司战略决策与经营业绩的介入程度达到了前所未有的高度。在强大的资本压力下,企业高管团队的稳定性也受到严峻考验,年内共有32位CEO...
19:48
2026年1月5日,荃银高科正式发布重要公告,宣布其与控股子公司联合选育的52个杂交水稻和5个杂交玉米新品种成功通过国家审定。这一重大成果由第五届国家农作物品种审定委员会第八次主任委员会会议审议通过,标志着公司育种技术再获权威认可。 这些通过审定的新品种具有显著优势,不仅实现了优质、高产的双重突破,更在抗逆性方面表现出色,能够适应不同地区的复杂种植环境。...
19:48
2026年1月5日,全球知名芯片设计企业联发科正式公布重大战略调整,宣布将核心资源向人工智能专用集成电路(ASIC)和汽车芯片领域倾斜,开启全新市场布局篇章。这一战略转型标志着联发科在持续深耕移动芯片业务的同时,积极开拓高增长潜力的新兴领域,旨在抢占未来科技产业制高点。 此次战略升级的核心举措包括两大方向:一是显著提升人工智能ASIC业务的研发投入,二是加速...
19:48
2026赛季,中国赛车界迎来重磅消息:周冠宇将正式加盟凯迪拉克F1车队,担任官方储备车手一职。这一决定不仅标志着他职业生涯的全新起点,也再次印证了这位中国首位F1正式车手的非凡实力与潜力。 回顾周冠宇的F1征程,2024年底他结束与索伯车队的合作后,于2025赛季短暂效力于法拉利车队,担任第三车手。尽管与法拉利合约期满,但他并未离开F1的激烈战场,而是选择继...
19:48
2026年1月5日,湖南逸昊金属材料科技有限公司与福建福耀科技大学正式签署《产学研战略合作协议》,标志着双方将在金属材料领域开启深度合作新篇章。根据协议内容,双方将重点围绕合金材料研发、关键技术突破、项目申报与成果转化、人才培养体系构建以及资源共享机制等五大方面展开全面合作。此次合作将充分发挥湖南逸昊在金属材料领域的核心技术优势,以及福耀科技大学在科研创新方...
19:48
2026年1月5日,中国气象局国家卫星气象中心传来振奋人心的消息,成功研发出基于风云气象卫星数据的深度扩散模型,将强对流天气临近预报的有效时长从传统2小时大幅提升至4小时,为防灾减灾争取了宝贵时间。这一技术突破的核心在于充分利用我国自主研制的卫星数据资源,通过先进的深度学习算法,实现了对暴雨、雷暴、短时大风等极端天气现象更精准的预测和更及时的预警,显著增强了...
19:18
2026年1月5日,eBay平台上出现了一款极为罕见的谷歌初代Pixel内部原型机,引发科技爱好者和收藏家的广泛关注。这台设备并非普通商品,而是2016年谷歌发布初代Pixel手机时的设计验证测试(DVT)版本,代号" sailfish-ROW-DVT"。机身表面清晰标注"非卖品"和"谷歌资产"标签,有力证实了其作为内部测试样品的特殊身份。 这台原型机在硬件...
19:17
信达国际最新研报发布,对禾赛-W(02525)维持"买入"评级,并给出200港元的目标价。报告深入分析了禾赛在行业中的独特优势,指出其盈利能力与现金流表现显著优于同业,这是支撑其估值溢价的核心因素。据专业预测,禾赛在2024至2027财年期间,收入与经调整盈利的年复合增长率有望分别达到41%和321%,展现出强劲的增长潜力。 目前市场数据显示,禾赛的股价对应...