Skip to content

计费与 Plans

计费信息在控制台的 Usage 和 Billing 区域查看。核心目标是按产品工作负载、Provider 账号、Model Group 和 API key 理解费用。

Usage Analytics

可以追踪什么

  • 请求量。
  • 输入、输出和总 tokens。
  • 花费和 credits 消耗。
  • 错误率和延迟。
  • 按 API key、model group、backend 或 model 查看用量。
  • 支持时查看 Coding Plan quota 和 reset window。

如何阅读用量

使用 model-group 视图理解产品成本。使用 backend 视图发现 Provider 账号压力、余额不足、限流或 plan 耗尽。使用 API-key 视图把流量归因到应用、环境或客户。

Plans 与 Credits

One AI Gateway 可以同时展示 gateway-level credits 和 provider-level plan / balance 信息。按量计费 backend 会在支持时显示余额;Coding Plan backend 会在支持时显示 quota window 和 reset 时间。

运营建议

  • 为每个生产 model group 设置预算预期。
  • 大量 coding-agent 使用后检查 Coding Plan quota。
  • 在错误扩散到产品前,先关注 backend-level errors。
  • 对任何 quota 有限的 Provider 账号配置 fallback routing。

面向多模型、多 Provider 和 Coding Plan 场景的统一 AI Gateway 文档。