来源:Google AI Blog · AI · 北美洲 · 04-03 00:00
Google 为 Gemini API 推出 Flex 与 Priority 两档推理服务
原标题:New ways to balance cost and reliability in the Gemini API
AI 情报摘要
Google 通过新增 Gemini API 推理层级,为开发者提供更灵活的成本与性能选择。
关键点
- Gemini API 新增 Flex 和 Priority 两种 inference tiers。
- Flex 主要面向成本敏感型应用,适合可接受一定延迟波动的任务。
- Priority 面向低延迟和高可靠性需求场景,适合生产级关键应用。
影响分析
此举有助于 Google 提升 Gemini API 对不同开发者和企业场景的适配能力,增强其在生成式 AI 云服务市场的竞争力。
情绪:利好 · 相关:Google / Google AI Blog / Gemini API / 北美洲 · LLM 已生成
Google AI Blog 发布消息称,Gemini API 新增 Flex 和 Priority 两种推理层级,帮助开发者在成本、延迟和可靠性之间进行取舍。Flex 更偏向降低成本,Priority 则面向对响应速度和稳定性要求更高的场景。