计费与 Plans
计费信息在控制台的 Usage 和 Billing 区域查看。核心目标是按产品工作负载、Provider 账号、Model Group 和 API key 理解费用。
可以追踪什么
- 请求量。
- 输入、输出和总 tokens。
- 花费和 credits 消耗。
- 错误率和延迟。
- 按 API key、model group、backend 或 model 查看用量。
- 支持时查看 Coding Plan quota 和 reset window。
如何阅读用量
使用 model-group 视图理解产品成本。使用 backend 视图发现 Provider 账号压力、余额不足、限流或 plan 耗尽。使用 API-key 视图把流量归因到应用、环境或客户。
Plans 与 Credits
One AI Gateway 可以同时展示 gateway-level credits 和 provider-level plan / balance 信息。按量计费 backend 会在支持时显示余额;Coding Plan backend 会在支持时显示 quota window 和 reset 时间。
运营建议
- 为每个生产 model group 设置预算预期。
- 大量 coding-agent 使用后检查 Coding Plan quota。
- 在错误扩散到产品前,先关注 backend-level errors。
- 对任何 quota 有限的 Provider 账号配置 fallback routing。