思维链、指令微调和智能涌现,这些关键思想正引领着大模型研发的浪潮。其中,思维链技术(Chain of Thought)更是被誉为现代大语言模型产生「涌现」现象的底层技术,为AI领域带来了前所未有的突破。思维链的核心目标,是通过向大语言模型展示少量样例,并详细解释其推理过程,引导模型在生成答案时展现逻辑推理,从而提升答案的准确性。这一技术犹如将黑盒深度学习的多步推理过程拆解开来,将各个步骤解耦,既减轻了模型每一步的压力,又增强了可解释性,最终实现了模型性能的提升。

思维链的灵感,源于一次偶然的阅读体验。CoT的提出者Jason Wei曾分享,他的灵感来自于美国无神论者、公共知识分子Sam Harris所著的《Waking up》一书。这本书从灵修的角度探讨了思维、意识和自我的关系,深深触动了Jason Wei。受此启发,他开始思考人类思维与AI模型之间的关系,最终孕育出了思维链的概念。

Jason Wei,这位达特茅斯大学毕业生,在大模型研发领域拥有丰富的经验和卓越的成就。在谷歌工作期间,他曾主导推广了大语言模型中的思维链提示、指令微调和模型涌现等一系列关键思想,为AI领域的发展做出了重要贡献。

对于许多华人家庭来说,美国梦曾是让孩子进入常春藤盟校,在华尔街谋得一份体面的工作。而Jason Wei却选择了人工智能研究,成为朋友圈中唯一的AI研究者。他的早期化学研究经历,教会了他如何提出严格的假设并进行测试,为他日后在AI领域的研究奠定了基础。在达特茅斯大学期间,他创建了第一个可以对肺癌进行分类的神经网络,尽管经历了六次被拒的挫折,但他最终成功发表了这篇论文。

Jason Wei在达特茅斯大学期间,曾与校友Sam Greydanus交流,后者给予了他许多宝贵的建议,包括阅读Arxiv、发布代码和撰写博客文章等。这些建议对Jason Wei的研究之路产生了深远的影响。

在谷歌AI Residency项目中,Jason Wei展现出了卓越的研究能力,最终成功留在谷歌担任长期研究员。思维链项目的灵感,来源于他对冥想的兴趣。他认为,人类和AI模型都可以拥有「思想流」,而思维链则是一种更有逻辑和组织性的思维过程。

Jason Wei在谷歌期间,也领导了finetuning(微调)项目,这项工作面临着防止过拟合、设计实验和进行消融实验等挑战。他和团队为模型手动编写了数百条指令,以防止过拟合,并率先在Google内部尝试微调大语言模型以遵循指令。

在团队中,Jason Wei与许多优秀的合作者一起工作,他们拥有极高的标准,不断推动彼此进步。他的同事Quoc V. Le经常挑战他,要求他用更小的模型实现同样的功能,这促使Jason Wei不断突破自我。

Jason Wei对上下文学习、思维链推理和U形缩放等涌现能力充满兴奋。他认为,未来AI模型可能会具备规划能力,并表现出更好的通用性。对于想要在AI领域开展职业生涯的人来说,Jason Wei建议他们要努力工作,选择合适的研究课题,并积极提升研究、实验、论文撰写和推广等方面的能力。

Jason Wei的工作方式,是每天工作到晚上10点或11点,每周休息一天。他认为,工作的时长和专注程度同样重要,而睡眠和锻炼对他来说至关重要。尽管工作繁忙,但他依然喜欢旅行,并积极参与各种会议,结识新朋友,探索新城市。

对于研究者来说,Jason Wei提出了四点建议:选择研究课题、进行实验、撰写论文和做宣传。他认为,推广和宣传工作虽然费时费力,但却非常重要,研究者应该花与实际工作一样多的时间来做宣传。

Jason Wei的研究经历和心得,为AI领域的研究者提供了宝贵的启示。他的努力和坚持,也为我们展示了通往AI未来的道路。

最新快讯

2026年04月15日

12:02
微新创想:最近美国市场什么混休题材最火?“传送带+射击”还是“分颜料水”?其实在出海新品「Jewel Coloring」(AppMagic 显示发行账号注册地为中国香港)面前都要让一让,这款产品把国内火爆的一种线下益智玩法——“拼豆(贴钻石画)”搬上移动端后迅速走红,在4月5日-6日登顶美国 iOS 手游下载总榜。 4月5日美国 iOS 手游下载总榜 | 数...
12:02
微新创想:B站宣布在App端上线播放页暂停广告,这一举措引发了全网热议。用户在手动暂停视频时,广告将概率性出现,但用户和UP主均可主动关闭。消息一出,迅速登上热搜第一,众多B站用户纷纷表达不满。尽管优爱腾芒等平台早已采用120秒贴片广告、中插小剧场、暂停广告等多种广告形式,但一到B站,用户对广告的容忍度几乎归零。然而,这一消息也带来了积极影响,B站股价在开市...
12:02
微新创想:近日,DeepSeek 在其官网上发布了最新的招聘信息,首次在内蒙古乌兰察布地区提供了岗位。除了杭州和北京的职位,此次招聘为在乌兰察布建设的数据中心招募专业人才。该数据中心的建设将进一步推动当地的云计算产业发展。 DeepSeek 此次招聘的两个主要岗位为数据中心高级交付经理和数据中心高级运维工程师,薪资范围为 15,000 到 30,000 元,...
12:02
微新创想:谷歌DeepMind最近做了一件在AI圈颇为罕见的事正式设立全职哲学家岗位而且这在头部AI实验室中尚属首次。出任这一职位的是剑桥大学学者Henry Shevlin预计5月正式入职。他的研究方向不是算法也不是模型架构而是机器意识人机关系以及人类究竟为AGI的到来做好准备了没有。 更关键的是他并非挂名顾问而是会真正嵌入DeepMind的实际研究流程参与...
12:02
微新创想:跨境电商这条赛道,最近越来越热闹。一边是中国企业出海势头正猛,带来了实实在在的市场红利;另一边,AI技术的快速渗透又打开了新的增长想象空间。嗅觉敏锐的玩家们纷纷入局,而老牌巨头亚马逊,早已悄悄开始布局下一个时代。 微新创想:亚马逊给这个阶段起了个名字——跨境电商3.0时代。而它押注的核心筹码,正是AI。去年,亚马逊推出了AI购物助手Rufus。这个...
12:02
微新创想:天猫近日宣布将新增《AI 软件及应用类商品发布规范》。此举旨在进一步提升消费者的购物体验,通过明确商家在平台上发布 AI 软件及应用类商品时的行为标准,确保产品信息的真实性和透明度。该新规的征集意见阶段已于 2026 年 4 月 6 日结束,并在 4 月 14 日正式生效。 根据新规,所有天猫商家在发布 AI 软件及应用类商品时,必须将其归类至“网...
11:34
微新创想:2026年4月,安擎计算机正式向港交所递交上市申请,保荐人为中国国际金融香港证券有限公司。公司原计划在2023年冲刺深交所创业板,后于2025年9月转道港股。这一战略调整反映了企业在资本市场布局上的灵活应对与长远规划。 在递表前,公司完成新一轮融资,估值升至35.8亿元,较2022年增长近4倍。这一显著提升不仅体现了市场对公司未来发展的认可,也为其...
11:34
微新创想:2026年4月15日,康众医疗发布公告,宣布拟以现金方式收购AI医疗影像服务商脉得智能的控制权。根据公告,标的公司整体估值为7.5亿元。交易完成后,康众医疗将持有脉得智能51%或最低50.7355%的股权,具体比例取决于是否成功受让国有股东梁溪创投所持有的股份。 此次收购的资金来源为康众医疗的自有资金以及银行贷款。这一举措表明公司正在积极拓展其在人...
11:34
微新创想:2026年4月15日,美国得州奥斯汀特斯拉超级工厂内已停放超过50辆Cybercab无人驾驶出租车。据观察者乔·泰格迈耶提供的无人机画面显示,多辆Cybercab停驻在工厂内的碰撞测试设施旁,部分车辆已完成测试。 这些车辆目前仍配备有方向盘与踏板,主要是为了符合现行法规要求,并在实际道路环境中采集必要的测试数据。特斯拉正逐步推进无人驾驶技术的商业化...
11:33
微新创想:2026年4月14日,美国科技巨头亚马逊宣布以每股90美元、总价约116亿美元收购低轨卫星运营商Globalstar。这一重大交易标志着亚马逊在卫星互联网领域迈出关键一步。 交易完成后,亚马逊将获得Globalstar的频谱资源及近30颗在轨卫星。这些资源将被用于增强其Project Kuiper卫星互联网服务的性能和覆盖范围。 亚马逊此举旨在加快...
11:33
微新创想:4月14日,科技媒体networkright基于三星最新获批专利,首次渲染展示第二代三折叠手机Galaxy Z TriFold Wide。该机采用阔折叠方案,展开后近似紧凑型平板,折叠态保留外置副屏及三摄模组。 新铰链设计聚焦轻量化与超薄化,机身支持多角度折叠及独特帐篷模式,可三角立式稳定支撑,适用于视频播放或桌面显示场景。 目前该机尚未官宣上市计...
11:33
微新创想:2026年3月24日,赛克赛斯生物科技股份有限公司获上交所受理科创板IPO申请。该公司此前两次IPO均告终止:2020年撤回科创板申请,2025年1月终止深交所主板进程。本次由海通证券更换为光大证券作为保荐机构。 公司2025年营收达到3.38亿元、归母净利为1.69亿元。其核心产品赛脑宁®和赛络宁®在国内市场占有率分别高达91%和70%。这表明公...