微新创想:2026年3月3日,谷歌正式推出Gemini 3.1 Flash-Lite模型,宣称为其速度最快、成本效益最高的Gemini 3系列轻量级模型。该模型即日起向开发者开放预览版,可通过Google AI Studio的Gemini API及企业级Vertex AI平台调用。这一发布标志着谷歌在大模型领域持续发力,进一步拓展其在AI应用中的影响力。
Gemini 3.1 Flash-Lite的定价为每百万输入Token 0.25美元、输出Token 1.50美元。相较于前代产品,这一价格策略显著降低了使用成本,使更多开发者和企业能够负担得起高性能AI模型的调用费用。同时,该模型在性能方面也实现了突破性提升。
评测数据显示,Gemini 3.1 Flash-Lite的首字响应速度(TTFT)较前代产品提升2.5倍,整体输出速度提高45%。这使得模型在处理实时任务时更加高效,能够快速响应用户需求。在多个基准测试中,该模型表现优异,Arena.ai Elo得分为1432分,在GPQA Diamond测试中达到86.9%,在MMMU Pro测试中为76.8%。
此外,Gemini 3.1 Flash-Lite还引入了可调节的“思考层级”功能。这一创新使模型能够根据任务的复杂度自动调整处理深度,从而在保持高准确率的同时,优化计算资源的使用效率。对于需要快速响应的场景,用户可以选择较低的思考层级以获得更快的处理速度;而对于复杂度较高的任务,则可以启用更高的思考层级以确保输出质量。
Latitude等企业已开始实际部署Gemini 3.1 Flash-Lite模型。这表明该模型不仅在技术层面具备竞争力,而且在实际应用中也展现出强大的适应能力。随着更多企业加入,Gemini 3.1 Flash-Lite有望在多个行业领域中发挥重要作用,推动AI技术的进一步普及和应用。
