复制粘贴Prompt技巧:让AI准确率飙升97%的神奇方法

复制粘贴Prompt技巧:让AI准确率飙升97%的神奇方法插图1

声明:本文源自微信公众号数字生命卡兹克,作者数字生命卡兹克,授权站长之家转载发布。前两天,我在网络世界中偶然发现了一种令人惊叹的Prompt技巧。通过反复输入提示词,非推理类大模型的准确率竟可从21.33%一跃提升至97.33%。这一创新技巧源自Google发布的一篇趣味论文,题为《Prompt Repetition Improves Non-Reasoning LLMs》,翻译过来便是:重复你的问题,让AI变得更聪明。听起来似乎有些玄妙,实则极为简单。以一个具体例子说明:你曾询问AI:“梵蒂冈圣伯多禄大教堂门口共有多少根柱子?”现在,你可以将其改为:“梵蒂冈圣伯多禄大教堂门口有几根柱子?梵蒂冈圣伯多禄大教堂门口有几根柱子?”注意,这里并非简单复制粘贴,而是将问题重复输入。这个Prompt技巧,本质上就是传说中的CV大法——Ctrl C + Ctrl V。根据Google的实验数据,这一看似简单的操作,竟能显著提升AI回答正确的概率。在70个不同的测试任务中,这一“土味招数”以47胜23平的战绩脱颖而出,一次未尝败绩。更令人惊叹的是,在某些任务上,准确率甚至能从21%直接飙升到97%。当我初次看到这一结论时,内心充满了震撼:( ´・・)ノ(._.`)????这感觉,宛如历经千辛万苦攀登至喜马拉雅之巅,只为求见传说中的武林宗师,结果宗师却捋着胡须告诉你,天下第一的武功秘籍,就五个字:“大力出奇迹”。尼玛,充满了B级片的荒诞感。但请先别急着嘲笑。经过一番深入探究,我发现这篇看似简单的论文及其背后的原理,确实蕴含着深刻的洞见。先来了解一下Google的实验设计。他们选取了七种市面上最主流的一线非推理模型,包括Gemini2.0Flash与Flash Lite、GPT-4o和4o-mini、Claude3Haiku、3.7Sonnet,以及DeepSeek V3,全部使用官方API,在各类基准测试中进行了严谨的对比。值得注意的是,这类Prompt技巧主要针对非推理模型,如DeepSeek V3,而DeepSeek R1则属于推理模型。非推理模型与推理模型各有优劣,核心区别在于速度与准确性。推理模型虽然准确率高,但速度往往过慢,例如我常让GPT5.2Thinking处理任务或搜索信息,仅需思考环节就耗费8分钟。而非推理模型则无需思考,直接执行任务,速度极快,但准确性相对较低。如今,这一复制大法能让非推理模型在保持速度的同时大幅提升准确性,在许多场景下极具实用价值。回到实验本身,他们选取了包括ARC、OpenBookQA、GSM8K、MMLU-Pro、MATH等常见测试集,以及自行设计的NameIndex和MiddleMatch两个创新测试。NameIndex要求模型从50个名字列表中找出第25个名字,而MiddleMatch则是让模型在包含随机重复多个名字的列表中,找出两个指定字符之间的名字。这两个测试设计得颇具巧思。实验过程中,他们进行了一项看似简单却效果显著的操作:将原问题重复粘贴一次,中间不加任何解释或修饰词,如“please”、“think step by step”,也不添加其他Prompt或示例,仅仅是原问题后直接粘贴一遍。结果,成功率实现了爆炸式增长。根据论文原文,这一“土味招数”在70组测试中赢得了47次,平局23次,一次未败。效果之显著令人瞠目结舌。他们还尝试了重复三遍等衍生技巧,发现效果同样出色。为何重复一次就能提升效果?论文给出了工程层面的解释:大模型在训练时采用“因果语言模型”方式,即从左到右逐词预测。当前token在计算时只能看到之前的词,无法预知后续内容。因此,当你重复问题后,Q2中的每个字在计算时都能回顾Q1的全部信息,相当于给予AI一次“回头看、再思考”的机会。用更通俗的例子说明:假设你给AI一个绕口的选择题:选项:A.将蓝色方块放到红色方块左边B.将红色方块放到蓝色方块左边场景说明:当前红色在左,蓝色在右。问题:哪个选项会改变画面?只输出A或B。作为AI,你如同观看视频字幕,读到A、B时还不知画面情况,对这两个选项的第一印象会非常模糊。直到读到场景说明,你知道答案,但字幕已过,无法回头重新阅读A、B来更新印象。而按照论文方法,将整段复制一遍后,第二遍的A、B已包含第一遍的全部信息,模型在读取选项时,脑海中会结合场景条件生成更准确的选项表征,从而更容易得出正确答案。这就像你观看《流浪地球2》或《盗梦空间》时,第二次观影往往能获得更全面、更深刻的领悟。重复的力量,就在于此。它给予AI多一次重来的机会。为何这种技巧对DeepSeek R1这类推理模型效果不佳?原因在于,许多通过RL微调的推理模型已自行掌握这一技巧。它们在推理时,第一反应往往是先复述问题,例如回答开头常出现的:“题目问的是……”“我们需要求解的是……”“首先我们需要理解题目给出的条件……”本质上,它们已在自动重复题目,重新组织答案。阅读这篇论文时,我始终有种强烈感受:我们对Prompt工程的想象,或许过于浪漫化。总以为好的提示词应结构清晰、层层递进,包含role、rule、context、format等元素,如同咨询公司制作的PPT,一页页阐述逻辑,最终提出完美问题。过去两年,大模型相关内容中,Prompt常被神化为一种玄学,写提示词如同念咒语,讲究格式、语气、敬语,要学习各种模板,甚至背诵prompt手册。我其实一直不甚认同,前段时间还分享了自己的Prompt心法。但说真的,对许多纯粹问答场景,尤其是短问题,模型根本无需复杂的提示词。只需将题目重复一遍,已能实现强大优化。Google论文也探讨了未来方向:将重复提示融入模型训练流程,让模型在预训练或微调阶段就适应这种结构;或仅在KV cache中保留第二遍提示,确保推理阶段性能不受影响;或仅重复提示词部分内容而非全文;甚至可考虑在多模态中重复,如图像、视频。我们总试图用复杂语言解决问题,却往往发现,最有效的答案有时只是一句顺口又重复的话。这与许多我们熟悉的领域不谋而合。人类社会一直在运用复制粘贴技能,只是赋予其体面名称:复述、强调、排比、朗诵、咏唱、抄经、背诵、晨读、开大会、宣誓、校训等。突然想起一个私人化场景。有一段时间,我的数据表现不佳,内容创作似乎无人问津,方向也感到迷茫,情绪低落,同时还要处理大量项目管理事务、各种意外,身体状况也每况愈下。某天与朋友聊天,情绪崩溃,哭诉了几句。对方只回了一句简单的话:“你已经做得很好了。”我回以“哈哈哈,哪有”。几分钟后,他又发来同一句话。又隔十几分钟,他第三次发来:“你已经做得很好了,真的。”那一刻,我瞬间释然。人类的许多情感,确实需要通过重复来构建。从这个角度看,复制粘贴似乎也不再卑微。爱一个人,是日常的复制粘贴;专业是一辈子的复制粘贴;写作是对某些想法一遍遍的复制粘贴,直到某天,这些内容不再需要刻意想起,它们已自然从你的指尖和眼神中流淌出来。AI的世界,很大程度上是压缩过的人的世界。当你下一次在终端敲下Prompt时,或许可以在末尾多敲一次Ctrl+V。同样,当你觉得人生混乱时,也许可以找几句真心认同的话,写在记事本、手机备忘录,或贴在桌边墙上,反复观看。从一堆token中看到真正重点,需要的是几次重复后的清晰;而从一地鸡毛中看到一丝意义,生活,很多时候也是如此。高山之流水,万物皆重复。

复制粘贴Prompt技巧:让AI准确率飙升97%的神奇方法插图2

复制粘贴Prompt技巧:让AI准确率飙升97%的神奇方法插图3

复制粘贴Prompt技巧:让AI准确率飙升97%的神奇方法插图4

复制粘贴Prompt技巧:让AI准确率飙升97%的神奇方法插图5

复制粘贴Prompt技巧:让AI准确率飙升97%的神奇方法插图6

复制粘贴Prompt技巧:让AI准确率飙升97%的神奇方法插图7

复制粘贴Prompt技巧:让AI准确率飙升97%的神奇方法插图8

最新快讯

2026年01月22日

17:15
韩国现代汽车工会于本周四正式向公司发出严正警告,要求在未与工会进行充分协商的前提下,不得擅自部署人形机器人。工会方面表示,现代汽车计划于2028年在美国工厂引入机器人技术并扩大产能,此举将可能对现有就业岗位造成冲击。尽管该扩张计划已推动公司股价创下历史新高,但员工们普遍担忧自己的工作岗位将因此被削减。 工会明确强调,任何新技术的应用都必须经过劳资双方的共同同...
17:15
2026年1月22日 人中之龙工作室重磅官宣《人中之龙 极3 / 极3外传 Dark Ties》试玩版现已全面登陆PS5、Xbox Series X|S、Switch 2及PC平台。本次试玩版特别呈现双剧情线内容,让玩家可沉浸体验截然不同的故事走向,但需注意存档数据将无法继承至正式版,请谨慎保存游戏进度。 正式版将于2月12日正式发售,游戏将完美支持中文...
17:15
2026年1月22日,商务部在新闻发布会上公布了一组令人瞩目的数据,展现了中国新能源汽车市场的强劲发展势头。2025年,中国新能源汽车零售量同比增长17.6%,渗透率持续攀升,每售出10辆乘用车中已有6辆为新能源车型,这一数字充分体现了消费者对绿色出行的广泛认可。 中汽协最新数据显示,2025年中国汽车产销量分别达到3453.1万辆和3440万辆,连续17年...
17:15
2026年1月21日,丹麦哥本哈根——全球领先的音频解决方案提供商Jabra捷波朗在一场备受瞩目的产品发布会上正式推出了全新的Evolve3办公娱乐耳机系列,为专业人士带来革命性的听觉体验。该系列精心设计了两种型号:贴耳式75型和包耳式85型,完美适配不同用户的佩戴习惯和使用场景。 Evolve3系列不仅在设计上追求时尚感,更将企业级功能发挥到极致。其核心亮...
17:15
2026年1月22日,备受期待的《真・三国无双起源》大型DLC“梦幻四英杰”震撼登陆PS5、Xbox Series X|S、Switch 2及PC平台,为玩家带来前所未有的三国冒险体验。该DLC在Steam国区售价174元,以其丰富的内容创新和沉浸式剧情设计,迅速引发玩家热议。作为游戏本体于2025年1月17日发售的延续,“梦幻四英杰”不仅强化了核心玩法,更...
17:15
2026年1月22日,追觅科技创始人俞浩就品牌与陈飞宇合作引发的争议正式作出回应。这一事件起因于陈飞宇粉丝在俞浩社交平台评论区集中质疑追觅频繁变更官宣及物料时间安排,认为其缺乏对合作方的尊重与诚意。面对舆论压力,俞浩在回应中明确表示,追觅方面并未收到来自陈飞宇本人或其工作团队的任何正式沟通,所有不满情绪均由粉丝自行表达,且部分行为已接近网络暴力的范畴。 俞浩...
17:15
2026年1月前半月,国内工程机械市场展现出稳健的发展态势,订单量保持稳定。随着春节假期的结束,市场普遍预期内需将迎来传统旺季,为行业增长注入强劲动力。这一积极预期主要得益于多重利好因素的叠加:一是设备更新换代周期逐步开启,大量存量设备进入淘汰期;二是电动化转型加速推进,新能源工程机械产品受到市场青睐;三是新农村建设战略持续推进,为工程机械产品提供了广阔的应...
17:15
2026年1月22日,一个具有里程碑意义的事件正式拉开帷幕——国家顶级域名解析节点(雄安)正式启用。这一关键基础设施坐落于河北雄安新区,由权威机构中国互联网络信息中心(CNNIC)牵头建设,并与知名企业雄安移动紧密合作完成实施。该节点肩负着“.CN”等国家顶级域名的权威解析重任,标志着我国网络基础设施建设迈入全新阶段。 作为"十四五"规划中的新基建重点项目,...
17:15
2026年1月22日,亚虹医药传来振奋人心的消息,其子公司Asieris Pharmaceuticals (Aus) Pty Ltd在澳大利亚成功获得APL-2401(ASN-8639片)Ⅰ期临床试验的批准。这款备受瞩目的创新药物,将针对FGFR2/3驱动的晚期实体瘤患者展开临床研究,为该领域患者带来新的治疗希望。值得一提的是,该试验已获得当地伦理委员会的严...
17:01
我们正站在生成式人工智能引领的深刻变革风口浪尖。以ChatGPT、文心一言、通义千问为代表的大模型正经历一场从实验性工具到新一代信息枢纽与决策助手的华丽转身。用户获取信息的模式正在发生颠覆性变革——从传统的"关键词匹配"搜索,转向与AI展开自然流畅的"智能对话"。这一全新范式对传统搜索引擎优化(SEO)构成严峻挑战,品牌面临前所未有的核心命题:在AI主导的对...
17:01
红魔11 Air于1月20日正式亮相,在叠加国家补贴后,其到手价仅为2999元起,这一极具竞争力的价格迅速吸引了市场目光。根据官方公布的数据,红魔11 Air在首销阶段便取得了102%的同比增长,首战即告捷,展现出强大的市场号召力。 红魔11 Air以其独特的存在感成为Air机型中的佼佼者。它不仅拥有最激进的性能调教,更是市面上首款真全面屏Air与透明背壳A...
17:01
微新创想1月22日重磅消息,今年上半年安卓阵营将迎来两场备受瞩目的折叠旗舰发布会,分别是OPPO Find N6和荣耀Magic V6。据行业博主最新爆料,荣耀Magic V6的发布时间已悄然提档,预计将在今年上半年正式亮相。回顾上代产品荣耀Magic V5,其于2025年7月2日震撼登场,因此可以预见,荣耀Magic V6将延续这一节奏,在上半年为用户带来...