亚马逊SageMaker AI新增OpenAI兼容API 实现多模型实时推理托管

微新创想:近日,亚马逊 SageMaker AI 宣布推出支持 OpenAI 兼容 API 的实时推理端点。这一功能的上线为开发者带来了极大的便利,用户只需更改端点 URL,即可使用 OpenAI SDK、LangChain 或 Strands Agents 等工具调用 SageMaker AI 上的模型。无需进行额外的客户端定制、SigV4 封装或代码重写,即可实现无缝对接。

SageMaker AI 的功能丰富,支持在自有基础设施上构建多步骤 AI 代理的工作流。例如,用户可以使用 Strands Agents 或 LangChain 等框架,结合 SageMaker AI 的强大计算能力,实现更复杂的 AI 应用场景。同时,推理过程可以在用户的 GPU 实例上进行,确保数据安全与性能优化。

为了进一步提升用户体验,SageMaker AI 端点开放了一个新的路径 /openai/v1。该路径能够接受聊天补全请求并直接返回响应,包括流式输出。这意味着用户可以像使用 OpenAI API 一样,轻松调用 SageMaker AI 上的模型,享受一致的接口体验。

所有使用标准 SageMaker AI API 和 SDK 的端点和推理组件均已启用 OpenAI 兼容模式。用户无需修改原有代码结构,只需调整 URL 即可将现有应用程序接入新的功能。这种灵活性大大降低了迁移成本,提高了开发效率。

用户还可以在同一个 SageMaker AI 端点上托管多个模型。例如,可以同时部署用于通用任务的 Llama 模型、针对特定领域的微调 Mistral 模型,以及用于分类的小型模型。所有模型都可以通过相同的 OpenAI SDK 进行访问,实现统一的管理与调用。

要使用这些功能,用户需要满足一定的前提条件。首先,必须拥有 AWS 账户并具备相应的权限。其次,需要安装 SageMaker 和 OpenAI 的 Python SDK。此外,模型需要存储在 Amazon S3 中,以便 SageMaker AI 可以高效地调用。

在认证方面,SageMaker AI OpenAI 兼容端点支持 Bearer Token 认证。这种认证方式更加安全,同时也简化了用户的操作流程。SageMaker Python SDK 中内置了生成 Token 的工具,用户可以轻松完成认证步骤。

实际操作中,用户可以快速部署单模型端点或推理组件端点。这种方式不仅便于管理,还能在单个端点上托管多个模型,提升资源利用率。通过 OpenAI Python SDK,用户可以简单地调用这些模型,获取所需的推理结果。

这项新功能的推出,使得 SageMaker AI 与现有的 AI 应用无缝对接。无论是开发新项目还是优化现有系统,用户都能享受到更高效、更灵活的推理解决方案。同时,这一更新也体现了 Amazon 在推动 AI 技术普及与应用方面的持续努力。

最新快讯

2026年05月21日

16:06
微新创想:在2026年5月20日召开的I/O2026大会上,谷歌宣布对其核心搜索业务进行25年来最彻底的重构。伴随着Gemini3.5Flash的全面植入,谷歌正式推出了一系列由AI驱动的全新广告格式,彻底打破了传统搜索广告与搜索结果之间的界限,让广告从“被动展示”进化为“主动的对话式服务”。 谷歌此次推出的新型广告,旨在通过Gemini的推理能力,让商业信...
16:05
微新创想:AI领域头部企业DeepSeek(深度求索)近日正式启动全新代码智能体(Coding Agent)业务。据其官方网站及资深研究员陈德里发布的信息,DeepSeek内部正在组建“Harness”团队,全力打造一款桌面端智能体编程产品。其内部核心对标对象正是Anthropic旗下的明星工具Claude Code。 目前,DeepSeek北京总部已上线A...
15:59
微新创想:凌晨拉了一位醉酒乘客,41元的车费。结果乘客一挥手,付了14万。长沙出租车司机唐师傅回忆,5月17日凌晨,一位乘客单独上车,喝得醉醺醺的,“叫了半天都不醒”。到目的地后,唐师傅告知车费41元,乘客付了款就下车了。唐师傅下班回家,手机充电时睡前看了一眼钱包余额,发现多了十几万,“给我吓懵了,那么多钱”。 他赶紧翻看记录,才发现是那位醉酒乘客把41元付...
15:59
微新创想:2026年5月21日,美国万通证券宣布作为唯一配售代理,为人工智能安全企业AITX完成总额70万美元的私人配售。此次融资在美国进行,旨在支持该公司AI驱动的安全与生产力解决方案研发及市场拓展。配售所得在扣除代理费及其他发行费用前约为70万美元。AITX总部位于美国,专注提供商用AI安防与自动化系统。
15:59
微新创想:5月21日,东方甄选全国首家线下门店在北京正式营业。创始人俞敏洪亲临现场参加开业仪式,并详细阐述了此次布局的初衷。他表示,尽管线下门店的运营成本相对较高,利润空间也较为有限,但其带来的社会价值不容忽视。通过开设线下门店,东方甄选希望能够创造更多就业机会,提升社区的生活气息,同时为居民提供更加便捷的服务体验。 该线下门店的设立,充分借助了新东方现有的...
15:59
微新创想:2026年5月20日,瑞典Embracer集团宣布将《指环王/中土世界》《古墓丽影》等核心IP剥离,组建独立上市公司Fellowship。这一举措标志着Embracer在游戏产业布局上的重大调整,旨在通过专业化运营提升IP价值。 此次分拆借鉴了Asmodee与Coffee Stain的成功经验。这两家公司曾通过独立运营实现快速增长,Embracer...
15:59
微新创想:5月21日,张雪冠军赛车1:1复刻版交车仪式在广州隆重举行。此次交车仪式不仅是对张雪赛车生涯的致敬,更是品牌与公益结合的重要时刻。品牌“洗脸熊”于4月10日以500万元拍得该复刻赛车,善款已全额捐赠至嫣然天使基金,用于救助唇腭裂患儿。这一举动展现了企业社会责任感,也传递了积极向上的公益精神。 张雪在交车仪式上表示,她计划在本赛季末拍卖其53号真实赛...
15:59
微新创想:5月19日,凯德集团在新加坡正式启动第二届“社区韧性资助计划”。该计划总资助额达400万新元,面向中国、印度、新加坡和越南共12家公益组织,聚焦儿童与青少年发展。凯德希望基金出资350万新元作为初始资金,并首设“公益成效奖励基金”,对达成既定目标的机构提供额外奖励。此举旨在通过结果导向机制提升公益项目可持续性与影响力。
15:59
微新创想:2026年5月21日,SpaceX在提交IPO S-1文件前三个月完成对xAI的收购,整合其社交媒体平台、消费者聊天机器人及Grok AI的NSFW功能。此次收购标志着SpaceX在AI领域的进一步扩张,同时也引发了外界对其战略方向的关注。 文件指出,Grok的不敬、苛刻模式可能引发声誉损害,并警告其或生成露骨内容、非自愿图像、侵权及歧视性内容。这...
15:59
微新创想:2026年5月21日,谷歌高级副总裁詹姆斯·曼尼卡公开表示,AI短期内不会导致大规模失业。他质疑‘两年内50%岗位消失’等预测,称事实已证伪此类说法。 曼尼卡拥有牛津大学AI与机器人学博士学位,长期研究自动化与就业关系。他强调,AI影响主要体现为岗位重构而非简单消失——既有减少、也有新增和再定义。 他批评行业过度渲染失业风险,加剧公众焦虑,反而阻碍...
15:59
微新创想:2026年5月21日,四川德阳,英杰电气宣布其射频电源产品已成功切入国内头部存储企业供应链并实现批量供货。这一进展标志着公司在半导体设备领域迈出了重要一步,进一步巩固了其在行业内的技术领先地位。 公司现有产能可满足当前需求,正在建设的成都半导体基地将提升射频电源产能,以匹配行业高速增长。随着半导体产业的持续扩张,英杰电气积极布局产能扩充,确保能够稳...
15:59
微新创想:据美国联邦航空管理局(FAA)局长5月20日透露,SpaceX拟在五年内将年发射频次提升至1万次。该计划需以可靠性显著提升为前提,FAA明确表示将严格评估后方可批准。此举旨在支撑其庞大卫星星座建设——公司已于今年1月宣布计划部署100万颗卫星,构建环绕地球的太阳能AI数据中心网络。目前SpaceX年发射量约百次级,目标增幅超百倍。