Anthropic发布LLM Agent工具编写指南 提升开发效率

Anthropic 官方博客近日发布了一份极具价值的开发指南,题为《Writing effective tools for LLM agents—using LLM agents》,旨在为开发者提供系统化方法,通过 Model Context Protocol(MCP)为大型语言模型(LLM)Agent 设计高效实用的工具。该指南以“原型 – 评估 – 协作”的三步迭代流程为核心框架,并提炼出五大关键设计原则,全面覆盖工具的有效性、可用性及性能优化,为开发者构建智能 Agent 提供了清晰的行动指南。

在工具选择阶段,指南首先强调决策的严谨性。开发者需深入分析 Agent 的核心需求,从功能匹配度、调用频率、资源消耗等多维度权衡工具的适用性,避免盲目堆砌功能导致系统臃肿。同时,指南提出构建清晰命名空间的必要性,通过模块化设计区分不同工具的职责范围,避免命名冲突造成的逻辑混乱。例如,可参考”工具名:动词+名词”的规范,如”fetchWeather:获取天气信息”,确保开发者能直观理解工具功能。

针对工具的上下文返回机制,指南提出三大优化方向。首先,返回值需具备强相关性,剔除冗余信息,仅保留对 Agent 决策有直接指导意义的数据。其次,通过结构化设计提升信息密度,如采用 JSON 格式封装数据,并设置标准字段(如 status、error、data)增强可读性。最后,在 Token 效率方面,建议开发者采用分词优化技术,将长文本拆解为关键短语,既降低传输成本又保证信息完整性。Anthropic 的实验数据显示,通过这些优化,工具的响应效率可提升 40% 以上。

Anthropic发布LLM Agent工具编写指南 提升开发效率插图1

提示工程作为提升工具可用性的关键手段,在指南中占据重要篇幅。开发者需通过精准的指令设计,使工具说明既简洁又全面。建议采用场景化描述,如”当用户询问’明天北京天气如何’时,调用 fetchWeather 工具”,并设置错误处理预案。Anthropic 的 Claude Code 工具经过 5000+ 脚本重构验证,其自动生成的提示模板准确率达 92%,充分证明数据驱动的工程方法在提升工具质量方面的有效性。

在评估体系方面,指南创新性地引入了分层测试机制。基础阶段采用留出测试集的交叉验证,防止过拟合;进阶阶段则通过多轮 A/B 测试对比不同设计方案的性能差异。Anthropic 开源的工具评估 Cookbook 包含 100+ 案例代码,涵盖从数据采集到结果分析的完整流程。特别值得关注的是,MCP 协议的底层 LLM 升级将同步推动工具能力的迭代,未来版本将支持更复杂的任务分解与多工具协同。

完整指南:https://www.anthropic.com/engineering/writing-tools-for-agents

最新快讯

2025年11月28日

19:01
2025年11月28日,胜科纳米正式宣布一项重大战略布局,其全资子公司青岛胜科计划投入约5亿元人民币,全力推进“青岛检测分析能力提升建设项目”。这一举措标志着胜科纳米在半导体检测与分析领域的深度拓展,旨在通过技术升级和产能扩张,进一步巩固其在第三方检测服务市场的领先地位。 该项目投资主体为青岛胜科或其关联企业,建设地点选址于青岛这一重要的科技创新中心。据...
19:01
2025年11月28日,中国创新药企贝达药业传来振奋人心的消息,其自主研发的盐酸恩沙替尼胶囊上市许可申请已成功获得欧洲药品管理局(EMA)的正式受理。这款备受瞩目的靶向药物,专为治疗间变性淋巴瘤激酶(ALK)阳性的非小细胞肺癌患者设计,此次获得EMA受理标志着其进军欧洲市场的关键一步,有望为欧洲患者带来全新的治疗希望。 该药物的申请材料基于一项全球多中心II...
19:01
2026年初,备受期待的M&M'S全新门店即将在上海迪士尼度假区迪士尼小镇盛大启幕。这家标志性门店坐落于迪士尼小镇入口附近黄金位置,将为游客提供集购物、餐饮与娱乐体验于一体的全方位休闲空间。玛氏中国官方宣布,此次新店开业将是品牌在中国市场战略布局的重要里程碑。据悉,新门店将精心打造沉浸式品牌体验空间,通过创新设计、互动装置和特色活动,让消费者深度感受...
19:01
2025年第三季度,美团核心本地商业分部遭遇了前所未有的经营困境,实现经营亏损高达141亿元人民币,较去年同期由盈转亏的局面形成鲜明对比。回顾去年同期,该分部曾实现经营溢利146亿元,经营利润率维持在令人羡慕的21.0%水平。然而,本季度这一数据急转直下,不仅扭亏为盈,反而跌至-20.9%的亏损区间,利润率大幅下滑41个百分点。 造成这一结果的主要原因是多方...
19:01
2025年11月28日,中国生物科技企业海特生物迎来重大突破,其参股公司研发的创新眼用注射液ZM-02正式获得美国食品药品监督管理局(FDA)的临床试验批准。这一里程碑事件不仅彰显了ZM-02的卓越研发潜力,更标志着该产品迈向国际化的关键一步。据悉,ZM-02将在美国境内开展严谨的临床试验,全面评估其在治疗各类眼部疾病方面的安全性与有效性。作为该项目的参股方...
19:01
2025年11月28日,医药企业泰恩康迎来重大突破,其全资子公司正式获得国家药品监督管理局颁发的巴瑞替尼片药品注册证书。这一里程碑事件不仅意味着该创新药物即将进入临床应用阶段,更标志着泰恩康在自身免疫疾病治疗领域迈出了关键一步。据悉,巴瑞替尼片作为一款口服JAK抑制剂,凭借其强大的抗炎特性,被批准用于治疗中重度斑秃及类风湿关节炎两大高发性自身免疫疾病。此次成...
19:01
首旅如家近日宣布与云迹科技达成战略合作,在上海等一线城市的多家门店成功引入煮面机器人,正式开启餐饮智能化升级新篇章。此次合作的核心目标在于全面升级旗下特色服务「如家这碗面」,通过引入自动化煮面机器人,显著提升早餐服务的餐饮效率与标准化水平,为消费者带来更稳定、更高效的用餐体验。 据悉,这款煮面机器人能够全流程自动化完成从取面、煮面到加汤等关键步骤,其卓越性能...
19:01
2025年11月28日,法国制药巨头昂利康正式宣布成功获得恩格列净二甲双胍缓释片(II)的药品注册证书这一重要里程碑。该创新复方制剂专为2型糖尿病患者设计,旨在提供更优化的血糖控制方案。值得注意的是,这款产品完全由昂利康自主研发并完成申报流程,彰显了其在糖尿病治疗领域的研发实力与创新能力。 此次获批不仅标志着恩格列净二甲双胍缓释片(II)正式获得上市许可,更...
19:01
2025年11月26日,全球存储芯片市场正面临前所未有的供应压力。由于人工智能基础设施建设的迅猛发展,对高性能存储芯片的需求急剧攀升,导致全球范围内出现明显的供应短缺现象。多家美国消费电子巨头已公开发出预警,表示可能因成本上升而不得不调整部分产品的定价策略。 戴尔公司首席运营官在当日举行的重要电话会议上明确指出,当前部分关键存储芯片的短缺情况已十分严峻,其成...
19:01
2025年11月28日,国金资管-新疆国信持有型不动产资产支持专项计划圆满完成发行,标志着我国不动产证券化领域再创佳绩。本期ABS发行总额高达54.6亿元人民币,原始权益方为太仓港协鑫发电有限公司,计划管理人由国金资管独家负责。这一创新产品不仅填补了新疆持有型不动产ABS的空白,更成为全国首单以火电厂为基础资产的持有型不动产证券化项目,具有里程碑式的意义。 ...
19:01
2025年10月,我国国际收支呈现稳健态势,货物和服务贸易进出口总额高达42858亿元,彰显了我国在全球贸易格局中的重要地位。其中,货物贸易表现尤为亮眼,出口额达到21630亿元,进口额为15217亿元,实现顺差6413亿元,进一步巩固了我国作为世界制造中心的领先优势。服务贸易方面,出口额为2607亿元,进口额为3404亿元,录得797亿元的逆差,反映出我国...
19:01
2025年11月28日,华阳股份旗下阳泉煤业集团七元煤业有限责任公司正式宣告进入生产阶段,标志着这一重大能源项目成功完成建设并全面投入商业化运营。该煤矿项目坐落于山西省阳泉市,由华阳股份100%控股,其设计年产能高达500万吨,是公司煤炭业务版图中的重要战略布局。 此次转产不仅意味着项目建设取得圆满成功,更代表着华阳股份在煤炭资源开发领域迈出了关键性步伐。项...