谷歌推出Gemini API多档位计费策略，弹性与批量档位享五折优惠，优先档位保障实时响应

2026-04-03 16:00:46 AI动态 4 次阅读

微新创想：谷歌近期对其 Gemini API 的计费结构进行了更新，旨在更好地满足用户的推理使用需求。这次更新带来了多种新的服务档位，包括标准、弹性、优先、批量和缓存版。用户可以根据自身的实际需求选择最合适的档位。

标准档位提供了基础的推理服务，用户可以根据自己的使用情况进行选择。该档位适用于一般的推理任务，能够为用户提供稳定的服务体验，同时保持合理的成本控制。

弹性档位则是一个创新的选择，它利用非高峰时段的闲置算力资源，为用户提供了标准价格的五折优惠。这个档位的目标延迟在 1 至 15 分钟之间，但并不保证固定的延迟时间，适合那些对时间要求不太严格的应用场景。通过弹性档位，用户可以在不影响服务质量的前提下，显著降低运营成本。

批量档位同样为用户提供了标准费率的五折优惠，适合需要处理大量数据的用户。延迟时间最长可达 24 小时，此档位特别适用于大规模的数据处理场景。用户在进行大量信息查询时可以大大节省成本，同时获得高效的计算资源支持。

在缓存档位方面，计费将依据缓存的词元数量与存储时长进行。该档位特别适合需要频繁调用复杂指令的对话机器人、长视频分析或大规模文档集的查询。通过合理使用缓存档位，用户能够有效管理存储和计算资源，提高系统的运行效率。

优先档位的定价则比标准价格高出 75% 至 100%，但能够在毫秒到秒级内控制延迟。这一档位非常适合那些需要实时响应的应用，如客服聊天机器人、实时欺诈检测和关键业务智能助手等场景。谷歌建议有需求的用户选择优先档位，以确保他们的应用程序在响应速度和效率上的最佳表现。

划重点：新增多种 Gemini API 服务档位，满足不同用户需求。弹性与批量档位提供五折优惠，适合大规模数据处理。优先档位确保毫秒级响应，适合实时应用场景。

2026年04月03日

17:08