跳到主要内容

计费规则与额度管理

本文档说明 Real200 的计费方式、Token 定价规则、额度管理和对账流程。

计费方式

Real200 采用 按 Token 使用量计费 的模式:

费用 = prompt_tokens × 输入单价 + completion_tokens × 输出单价

Token 说明

类型说明
Prompt Tokens您发送给模型的请求 Token 数(输入)
Completion Tokens模型返回的响应 Token 数(输出)
Total Tokens输入 + 输出

计费周期

  • 实际调用实时计费
  • 每次调用后立即扣费并更新额度
  • 额度不足时,API 返回 402 Payment Required 错误

定价规则

基础定价

Real200 的定价基于各供应商官方价格,通过渠道倍率进行调整。不同渠道可能享受不同的折扣。

智能路由定价

当启用智能路由时,Real200 会自动选择价格最优的可用供应商,无需手动比较。

:::tip 成本节省

通过智能路由,Real200 通常比直接使用官方 API 节省 15–30% 的成本。

:::

价格查询

您可以在以下方式查看实时价格:

  1. 控制台:登录 → 模型广场 → 查看每个模型的实时价格
  2. APIGET /v1/models 返回每个模型的价格信息
  3. 文档模型列表

额度管理

账户余额

  • 每个账户有一个总余额(quota)
  • 余额可通过充值增加
  • 余额不足时,所有 API Key 的调用将被拒绝

Key 级别配额

可以为每个 API Key 设置独立的配额上限:

配额类型说明
总额度该 Key 生命周期内可消耗的最大金额
月度额度该 Key 每月可消耗的最大金额
日额度该 Key 每天可消耗的最大金额

设置配额

  1. 登录控制台
  2. 进入 API Keys 页面
  3. 编辑目标 Key
  4. 在配额设置中填写额度值
  5. 保存

额度不足处理

当 Key 配额或账户余额不足时:

{
"error": {
"message": "账户余额不足,请充值后继续使用。",
"type": "insufficient_quota",
"code": "insufficient_quota"
}
}

此时 API 会返回 402 Payment Required 状态码。

对账与账单

调用日志

Real200 记录每次调用的详细信息,包括:

  • 调用时间
  • 使用的 API Key
  • 请求/响应 Token 数
  • 实际费用
  • 供应商信息
  • 延迟和状态码

账单导出

在控制台的 日志 页面,您可以:

  • 按日期范围筛选
  • 按 API Key 筛选
  • 按模型筛选
  • 导出为 CSV 格式

商家对账

对于需要给下游用户提供服务的商家:

  • 支持按渠道(channel)独立对账
  • 支持按用户独立统计
  • 支持预付费余额系统(阈值提醒、冻结、自动扣费)

详见商家级计费指南

常见问题

如何查看实时费用?

在控制台首页可以看到今日费用、Token 使用量和调用次数。在日志页面可以查看每次调用的详细费用。

流式响应如何计费?

流式响应与一次性响应的计费方式相同,按最终的 prompt_tokens + completion_tokens 计算。

失败调用是否计费?

如果请求未到达供应商(如被风控拦截、路由失败),不收取 Token 费用

Token 数量和费用的换算关系?

Token 数量由模型的分词器(tokenizer)计算,不同模型的 Token 化方式不同。费用按实际 Token 数 × 单价计算,详见各模型的定价说明。