思维链、指令微调和智能涌现,这些关键思想正引领着大模型研发的浪潮。其中,思维链技术(Chain of Thought)更是被誉为现代大语言模型产生「涌现」现象的底层技术,为AI领域带来了前所未有的突破。思维链的核心目标,是通过向大语言模型展示少量样例,并详细解释其推理过程,引导模型在生成答案时展现逻辑推理,从而提升答案的准确性。这一技术犹如将黑盒深度学习的多步推理过程拆解开来,将各个步骤解耦,既减轻了模型每一步的压力,又增强了可解释性,最终实现了模型性能的提升。

思维链的灵感,源于一次偶然的阅读体验。CoT的提出者Jason Wei曾分享,他的灵感来自于美国无神论者、公共知识分子Sam Harris所著的《Waking up》一书。这本书从灵修的角度探讨了思维、意识和自我的关系,深深触动了Jason Wei。受此启发,他开始思考人类思维与AI模型之间的关系,最终孕育出了思维链的概念。

Jason Wei,这位达特茅斯大学毕业生,在大模型研发领域拥有丰富的经验和卓越的成就。在谷歌工作期间,他曾主导推广了大语言模型中的思维链提示、指令微调和模型涌现等一系列关键思想,为AI领域的发展做出了重要贡献。

对于许多华人家庭来说,美国梦曾是让孩子进入常春藤盟校,在华尔街谋得一份体面的工作。而Jason Wei却选择了人工智能研究,成为朋友圈中唯一的AI研究者。他的早期化学研究经历,教会了他如何提出严格的假设并进行测试,为他日后在AI领域的研究奠定了基础。在达特茅斯大学期间,他创建了第一个可以对肺癌进行分类的神经网络,尽管经历了六次被拒的挫折,但他最终成功发表了这篇论文。

Jason Wei在达特茅斯大学期间,曾与校友Sam Greydanus交流,后者给予了他许多宝贵的建议,包括阅读Arxiv、发布代码和撰写博客文章等。这些建议对Jason Wei的研究之路产生了深远的影响。

在谷歌AI Residency项目中,Jason Wei展现出了卓越的研究能力,最终成功留在谷歌担任长期研究员。思维链项目的灵感,来源于他对冥想的兴趣。他认为,人类和AI模型都可以拥有「思想流」,而思维链则是一种更有逻辑和组织性的思维过程。

Jason Wei在谷歌期间,也领导了finetuning(微调)项目,这项工作面临着防止过拟合、设计实验和进行消融实验等挑战。他和团队为模型手动编写了数百条指令,以防止过拟合,并率先在Google内部尝试微调大语言模型以遵循指令。

在团队中,Jason Wei与许多优秀的合作者一起工作,他们拥有极高的标准,不断推动彼此进步。他的同事Quoc V. Le经常挑战他,要求他用更小的模型实现同样的功能,这促使Jason Wei不断突破自我。

Jason Wei对上下文学习、思维链推理和U形缩放等涌现能力充满兴奋。他认为,未来AI模型可能会具备规划能力,并表现出更好的通用性。对于想要在AI领域开展职业生涯的人来说,Jason Wei建议他们要努力工作,选择合适的研究课题,并积极提升研究、实验、论文撰写和推广等方面的能力。

Jason Wei的工作方式,是每天工作到晚上10点或11点,每周休息一天。他认为,工作的时长和专注程度同样重要,而睡眠和锻炼对他来说至关重要。尽管工作繁忙,但他依然喜欢旅行,并积极参与各种会议,结识新朋友,探索新城市。

对于研究者来说,Jason Wei提出了四点建议:选择研究课题、进行实验、撰写论文和做宣传。他认为,推广和宣传工作虽然费时费力,但却非常重要,研究者应该花与实际工作一样多的时间来做宣传。

Jason Wei的研究经历和心得,为AI领域的研究者提供了宝贵的启示。他的努力和坚持,也为我们展示了通往AI未来的道路。

最新快讯

2026年03月12日

01:54
微新创想:英特尔在美国正式推出酷睿Ultra 200S+系列台式机处理器 3月12日,英特尔在美国正式发布了酷睿Ultra 200S+系列台式机处理器。这一系列产品专为高性能桌面平台打造,采用了先进的制程工艺和混合架构设计,旨在提升整体性能表现。 该系列处理器主打AI加速与能效优化,为用户带来更高效的计算体验。通过集成AI专用核心,英特尔进一步增强了其在...
01:54
微新创想:3月12日,阿曼官方表示国内所有石油衍生品供应充足,市场运行平稳。这一消息由阿曼能源主管部门发布声明,明确指出当前能源供应状况良好。该声明的发布,主要是为了回应近期国际市场对能源供应稳定性的高度关注。阿曼方面强调,其炼化与分销体系运转正常,能够有效满足国内市场需求。为确保供应的持续性与可靠性,阿曼已采取一系列供应保障措施,包括优化库存调度和加强港口...
01:54
微新创想:2026年3月11日,盈科律师事务所通过官方微信号发布声明。梅向荣已辞去该所一切职务。 事件起因系其家人所办公司相关问题,与盈科执业活动无任何关联。 声明强调,律所当前经营正常、管理有序,将持续依法依规披露合规信息,并主动接受社会及行业监督。

2026年03月11日

23:51
微新创想:3月11日,深圳麦科田生物医疗技术股份有限公司正式向港交所递交上市申请。该公司总部位于广东深圳,拟通过首次公开募股(IPO)募集发展资金。华泰国际与摩根士丹利担任本次上市的联席保荐人。 麦科田生物专注于急危重症及围术期领域高端医疗器械的研发、生产与销售。其产品线涵盖注射泵、输液泵、生命支持设备等多个关键医疗设备类别,广泛应用于医院、急救中心等医疗机...
23:17
微新创想:3月18日,联想将在新品发布会上推出行业首款支持端侧一键部署OpenClaw的AI平板,覆盖小新Pro 13、小新Pro GT 13及YOGA Pad Pro 14.5 AI元启版。这款AI平板搭载的OpenClaw技术,能够实现本地大模型运行,大幅提升设备的智能化水平。同时,该技术还支持大屏定制交互,为用户提供更加个性化的使用体验。 零门槛部署是...
22:43
微新创想:2026年3月11日 螺舟工作室宣布国产神话武侠独立游戏《太吾绘卷:天幕心帷》完全版将于6月17日正式上线 该游戏为2018年首发的《太吾绘卷》续作 此次完全版新增动态CG 地区玩法 自建人物及奇遇系统 并优化地图与四季表现 原计划2026年春节(2月17日)发售 后延期至4月 现再度调整至6月17日 本作为首款鸿蒙全场景独家游戏 支持手机 平板 ...
22:43
微新创想:乐高近日传出消息,计划于2026年12月推出一款编号为72306的初代PlayStation主机积木套装。这款积木套装专为成人收藏家设计,包含1911块精巧零件,能够完整还原初代PlayStation主机及其经典手柄的外观与结构。根据爆料信息,该套装的定价为159.99美元,约合人民币1100元。 这一消息的传出,再次引发了乐高粉丝和游戏爱好者的广...
22:42
微新创想:3月11日,TikTok与苹果公司宣布合作,Apple Music订阅用户可在TikTok内直接播放完整歌曲,无需跳转。这一功能的推出为用户带来了更加流畅的音乐体验,无需离开当前应用即可享受完整的音乐内容。 该功能基于苹果的MusicKit技术实现,用户只需在TikTok视频中点击‘播放完整歌曲’按钮,即可调起内置播放器,无缝播放歌曲。这一设计不仅...
22:42
微新创想:2026年3月,75后吴传明正式出任国富人寿董事长。此前自2025年8月起,他已代行董事长职责,接替辞任的江亚东。吴传明在保险行业拥有丰富的经验,长期深耕保险监管与公司治理领域。他曾担任国富人寿总经理助理、党委副书记、首席信息官等重要职务,具备深厚的行业背景和管理能力。 2025年,国富人寿在业务发展方面取得显著成绩,全年实现保险业务收入45.61...
22:42
微新创想:腾讯云针对近期社交平台流传的安装OpenClaw后出现高额费用的传闻作出回应 腾讯云在3月11日发布声明,回应了关于公益装机活动中安装OpenClaw导致高额费用的质疑。根据官方调查,相关截图中显示的200余元费用并非由本次公益活动产生,而是用户之前使用大模型调用所产生的历史账单。腾讯云明确指出,OpenClaw的安装本身是免费的,但用户在实际使用...
22:42
微新创想 一款售价仅80元的Lululemon发圈近日在社交媒体上引发广泛关注。这款发圈以其简约的设计和品牌标识吸引了大量消费者的注意,成为讨论的热点。从品牌官方店铺页面可以看到,该发圈的饰边采用100%锌合金材质,主体则由86%聚酯纤维和14%氨纶制成,兼具舒适性与耐用性。 不少网友对这款发圈的突然走红感到意外。有人质疑是否是品牌新的营销策略,也有人表示不...
22:42
微新创想:经典互联网梗“杰哥不要啊”经过十余年的传播,如今被改编成一款第一人称恐怖游戏。这款游戏由Loser Studio开发,名为《在杰难逃》,已在Steam平台正式上线。玩家在游戏中将扮演一名受邀前往杰哥家做客的青少年,原本以为只是一次普通的聚会,但一踏入那栋充满诡异氛围的房屋,便发现自己陷入了一场精心设计的陷阱。 游戏的玩法围绕着紧张刺激的逃脱展开。玩...