谷歌近日对 Gemini API 的计费档位进行更新,优化方案与定价均基于实际推理使用需求制定。本次新增的推理服务档位包括:标准(Standard)、弹性(Flex)、优先(Priority)、批量(Batch)和缓存(Caching)版。其中,弹性推理档位通过利用非高峰闲置算力资源,提供标准价格五折优惠,目标延迟为 1 至 15 分钟,但不提供延迟保证。批量 API 档位同样提供标准费率五折优惠,延迟最长可达 24 小时。(财联社)

谷歌近日对 Gemini API 的计费档位进行更新,优化方案与定价均基于实际推理使用需求制定。本次新增的推理服务档位包括:标准(Standard)、弹性(Flex)、优先(Priority)、批量(Batch)和缓存(Caching)版。其中,弹性推理档位通过利用非高峰闲置算力资源,提供标准价格五折优惠,目标延迟为 1 至 15 分钟,但不提供延迟保证。批量 API 档位同样提供标准费率五折优惠,延迟最长可达 24 小时。(财联社)
登录后才可以发布评论哦
打开小程序可以发布评论哦