计费规则与额度管理
本文档说明 Real200 的计费方式、Token 定价规则、额度管理和对账流程。
计费方式
Real200 采用 按 Token 使用量计费 的模式:
费用 = prompt_tokens × 输入单价 + completion_tokens × 输出单价
Token 说明
| 类型 | 说明 |
|---|---|
| Prompt Tokens | 您发送给模型的请求 Token 数(输入) |
| Completion Tokens | 模型返回的响应 Token 数(输出) |
| Total Tokens | 输入 + 输出 |
计费周期
- 按实际调用实时计费
- 每次调用后立即扣费并更新额度
- 额度不足时,API 返回
402 Payment Required错误
定价规则
基础定价
Real200 的定价基于各供应商官方价格,通过渠道倍率进行调整。不同渠道可能享受不同的折扣。
智能路由定价
当启用智能路由时,Real200 会自动选择价格最优的可用供应商,无需手动比较。
:::tip 成本节省
通过智能路由,Real200 通常比直接使用官方 API 节省 15–30% 的成本。
:::
价格查询
您可以在以下方式查看实时价格:
- 控制台:登录 → 模型广场 → 查看每个模型的实时价格
- API:
GET /v1/models返回每个模型的价格信息 - 文档:模型列表
额度管理
账户余额
- 每个账户有一个总余额(quota)
- 余额可通过充值增加
- 余额不足时,所有 API Key 的调用将被拒绝
Key 级别配额
可以为每个 API Key 设置独立的配额上限:
| 配额类型 | 说明 |
|---|---|
| 总额度 | 该 Key 生命周期内可消耗的最大金额 |
| 月度额度 | 该 Key 每月可消耗的最大金额 |
| 日额度 | 该 Key 每天可消耗的最大金额 |
设置配额
- 登录控制台
- 进入 API Keys 页面
- 编辑目标 Key
- 在配额设置中填写额度值
- 保存
额度不足处理
当 Key 配额或账户余额不足时:
{
"error": {
"message": "账户余额不足,请充值后继续使用。",
"type": "insufficient_quota",
"code": "insufficient_quota"
}
}
此时 API 会返回 402 Payment Required 状态码。
对账与账单
调用日志
Real200 记录每次调用的详细信息,包括:
- 调用时间
- 使用的 API Key
- 请求/响应 Token 数
- 实际费用
- 供应商信息
- 延迟和状态码
账单导出
在控制台的 日志 页面,您可以:
- 按日期范围筛选
- 按 API Key 筛选
- 按模型筛选
- 导出为 CSV 格式
商家对账
对于需要给下游用户提供服务的商家:
- 支持按渠道(channel)独立对账
- 支持按用户独立统计
- 支持预付费余额系统(阈值提醒、冻结、自动扣费)
详见商家级计费指南。
常见问题
如何查看实时费用?
在控制台首页可以看到今日费用、Token 使用量和调用次数。在日志页面可以查看每次调用的详细费用。
流式响应如何计费?
流式响应与一次性响应的计费方式相同,按最终的 prompt_tokens + completion_tokens 计算。
失败调用是否计费?
如果请求未到达供应商(如被风控拦截、路由失败),不收取 Token 费用。
Token 数量和费用的换算关系?
Token 数量由模型的分词器(tokenizer)计算,不同模型的 Token 化方式不同。费用按实际 Token 数 × 单价计算,详见各模型的定价说明。