
谷歌近期发布了备受期待的 Gemini 2.5 Flash Native Audio 更新,为语音助手带来了革命性的性能提升。这一重大升级专注于优化复杂工作流程的处理能力,显著增强了执行用户指令的精准度,并大幅提升了对话的自然流畅度。根据谷歌官方数据,新版本在开发者指令遵循率上实现了从84%到90%的飞跃,这一显著进步充分证明了语音助手在理解与执行用户请求方面的卓越能力。
在多步骤对话体验方面,此次更新同样取得了突破性成果。用户在与语音助手互动时,将享受到前所未有的顺畅沟通感受。这种质的飞跃使助手能够从容应对复杂询问和多样化任务,为用户带来更加高效便捷的服务体验。谷歌特别强调,更新后的音频模型在专业基准测试 ComplexFuncBench 中表现优异,函数调用准确率高达71.5%,这一成绩超越了行业竞争对手 OpenAI 的 gpt-realtime(66.5%)。尽管谷歌未使用 OpenAI 最新版本进行对比,但这一数据已足以彰显其技术的领先地位。
此次重要更新已在多个平台上线,包括 Google AI Studio、Vertex AI、Gemini Live 和 Search Live,同时 Google Cloud 的客户也已率先体验这项创新技术。开发者们可以通过 Gemini API 对新模型进行全面测试,深入探索其无限潜力。这次升级不仅体现了谷歌在人工智能领域的持续创新,更彰显了其致力于提升用户体验的坚定决心。随着技术的不断迭代,谷歌正朝着打造更智能、更人性化的语音助手目标稳步前进。
划重点:
🌟 更新后的语音助手在遵循用户指令方面的准确率从84% 提升至90%。
📈 新版本在 ComplexFuncBench 基准测试中,函数调用准确率达到71.5%。
💻 开发者可通过 Gemini API 对新模型进行测试,体验其改进的功能。
