Anthropic发布LLM Agent工具编写指南 提升开发效率

Anthropic 官方博客近日发布了一份极具价值的开发指南,题为《Writing effective tools for LLM agents—using LLM agents》,旨在为开发者提供系统化方法,通过 Model Context Protocol(MCP)为大型语言模型(LLM)Agent 设计高效实用的工具。该指南以“原型 – 评估 – 协作”的三步迭代流程为核心框架,并提炼出五大关键设计原则,全面覆盖工具的有效性、可用性及性能优化,为开发者构建智能 Agent 提供了清晰的行动指南。

在工具选择阶段,指南首先强调决策的严谨性。开发者需深入分析 Agent 的核心需求,从功能匹配度、调用频率、资源消耗等多维度权衡工具的适用性,避免盲目堆砌功能导致系统臃肿。同时,指南提出构建清晰命名空间的必要性,通过模块化设计区分不同工具的职责范围,避免命名冲突造成的逻辑混乱。例如,可参考”工具名:动词+名词”的规范,如”fetchWeather:获取天气信息”,确保开发者能直观理解工具功能。

针对工具的上下文返回机制,指南提出三大优化方向。首先,返回值需具备强相关性,剔除冗余信息,仅保留对 Agent 决策有直接指导意义的数据。其次,通过结构化设计提升信息密度,如采用 JSON 格式封装数据,并设置标准字段(如 status、error、data)增强可读性。最后,在 Token 效率方面,建议开发者采用分词优化技术,将长文本拆解为关键短语,既降低传输成本又保证信息完整性。Anthropic 的实验数据显示,通过这些优化,工具的响应效率可提升 40% 以上。

Anthropic发布LLM Agent工具编写指南 提升开发效率插图1

提示工程作为提升工具可用性的关键手段,在指南中占据重要篇幅。开发者需通过精准的指令设计,使工具说明既简洁又全面。建议采用场景化描述,如”当用户询问’明天北京天气如何’时,调用 fetchWeather 工具”,并设置错误处理预案。Anthropic 的 Claude Code 工具经过 5000+ 脚本重构验证,其自动生成的提示模板准确率达 92%,充分证明数据驱动的工程方法在提升工具质量方面的有效性。

在评估体系方面,指南创新性地引入了分层测试机制。基础阶段采用留出测试集的交叉验证,防止过拟合;进阶阶段则通过多轮 A/B 测试对比不同设计方案的性能差异。Anthropic 开源的工具评估 Cookbook 包含 100+ 案例代码,涵盖从数据采集到结果分析的完整流程。特别值得关注的是,MCP 协议的底层 LLM 升级将同步推动工具能力的迭代,未来版本将支持更复杂的任务分解与多工具协同。

完整指南:https://www.anthropic.com/engineering/writing-tools-for-agents

最新快讯

2026年03月05日

14:10
微新创想:近日,重庆发生了一件令人感动的事情。罗女士在途中偶然发现一位大爷正准备将一只重达140斤的阿拉斯加犬送往狗肉馆。看到狗狗无助的眼神和凄惨的叫声,她内心十分触动,毫不犹豫地决定出手相助,花费600元将这只狗狗救下。 罗女士将狗狗带回了家,细心地为它洗了个澡。令人意想不到的是,这只狗狗似乎感受到了她的善意,在洗澡过程中竟然“感激地喊妈妈”。这一幕让...
14:10
微新创想 苹果正式发布了全新入门级笔记本MacBook Neo 起售价仅为4599元还可享受国补和教育优惠 这款的笔记本在吸引大量关注的同时 其规格层面的精准刀法也浮出水面 为了压低成本 MacBook Neo 并没有配备MagSafe磁吸充电接口 而是仅提供了两个USB-C接口用于充电与数据传输 然而 根据官方技术规格页面的深入细节 这两个外观一致的接...
14:10
微新创想 鸿蒙智行今日正式推出问界M6全新活力橙配色。这种配色通过高饱和度纳米色浆与高亮铝粉的巧妙结合,赋予橙色前所未有的立体感。干净不染尘,高闪不张扬,炽烈而富有层次的橙色,一眼便成为视觉焦点。 从官方发布的图片中可以看到,问界M6活力橙版在外观设计上充满亮点。前脸采用贯穿式LED大灯,下方两侧配有蓝色装饰灯带,搭配封闭式格栅与运动化前包围,整体造型动...
14:09
微新创想:成都宏明电子股份有限公司(证券简称:宏明电子,代码:301682)于3月5日披露招股意向书 正式启动创业板IPO发行 公司拟公开发行新股3038.7340万股 发行后总股本达1.215亿股 初步询价安排在3月10日 网上路演定于3月13日 宏明电子主营阻容类电子元器件及精密零组件 产品覆盖高可靠防务领域 如航空航天 武器装备等 同时产品还应用于民用...
14:09
微新创想:2026年3月4日,微软宣布在Windows 10/11版Copilot应用中新增原生网页浏览与网站密码同步功能。此次更新版本为v146.0.3856.39+,标志着Copilot在集成办公与生产力工具方面迈出了重要一步。 该功能目前仅面向Windows Insider用户开放测试。用户在使用Copilot时,可以直接点击链接,网页内容将在Copi...
14:09
微新创想:2026年3月5日,博主@数码闲聊站爆料称,OPPO Find X10系列正在测试全新的三摄方案。主摄、超广角以及长焦镜头均配备200MP的高像素配置,其中超广角镜头采用了1/1.56英寸的传感器,进一步提升画面的广度和细节表现。此外,该系列还有一颗来自三星HPC系列的1/1.3英寸新型CMOS,支持4×4 RMSC与UFCC技术,这将有助于提升图...
14:09
微新创想:2026年3月4日,苹果在新款MacBook Neo中针对双USB-C接口性能不对称问题,于macOS系统新增智能弹窗警告功能。该机型左侧USB-C接口支持10Gbps的传输速度,属于USB 3标准,能够连接4K/60Hz显示器。而右侧接口仅支持480Mbps的传输速度,属于USB 2标准,不具备视频输出能力。由于机身没有明确的物理标识,用户在使用...
13:55
微新创想:2026 年第一季度全球存储芯片市场迎来前所未有的价格波动 全球存储芯片市场在2026 年第一季度经历了一场剧烈的价格上涨。受人工智能数据中心对高性能存储需求的推动,DRAM 和 NAND 的价格涨幅远超市场预期。市场研究机构 TrendForce 最近调整了预测数据,原本预计 DRAM 在2026 年 Q1 合约价上涨 55%–60%,现在修正为...
13:35
微新创想:3月5日,默沙东公司正式宣布将关闭其位于美国北卡罗来纳州达勒姆的HPV疫苗生产线。这一决定影响了大约150名员工,他们将面临岗位调整或离职。此次停产是由于全球范围内HPV疫苗的需求出现下降,导致公司不得不采取产能优化措施。 默沙东表示,此次调整是为了确保其全球生产网络能够持续稳定地运行,并符合相关法规要求。公司指出,尽管生产线关闭,但在中国市场,H...
13:35
微新创想:2026年3月5日,哈萨克斯坦阿斯塔纳航空集团正式签署25架空客A320neo系列飞机确认订单。此次订单包括5架A320neo和20架A321neo。新机将由阿斯塔纳航空及其旗下的低成本航空公司飞狮航空共同运营。 微新创想:该集团目前已经运营了59架A320系列飞机。此次采购不仅有助于进一步扩大机队规模,还将显著提升其在区域航线上的运力。 微新创想...
13:35
微新创想:3月5日,阿曼石油营销公司一处燃料储存罐发生事故。事件发生在阿曼境内某运营地点,具体位置尚未公开。事故发生后,涉事公司迅速采取行动,立即启动了安全响应机制,并暂停了该地点的所有运营活动。公司方面表示,此次事故未造成人员伤亡,初步评估显示仅存在轻微的物理损坏,且没有泄漏或环境污染的迹象。目前,公司正积极配合相关部门进行详细调查,以查明事故原因并评估潜...
13:35
微新创想:2026年3月5日 苹果在英国及欧盟多国发售的2026款MacBook全系机型 包括MacBook Neo Air及Pro 均取消随附USB-C电源适配器 这一举措延续了苹果一贯的环保策略 与iPhone Apple Watch等产品保持一致 用户需要单独购买20W或更高功率的适配器 此次调整仅适用于欧洲市场 亚洲 北美等地的MacBook产品仍会...