计费规则与额度管理

本文档说明 Real200 的计费方式、Token 定价规则、额度管理和对账流程。

计费方式

Real200 采用 按 Token 使用量计费 的模式：

费用 = prompt_tokens × 输入单价 + completion_tokens × 输出单价

Token 说明

类型	说明
Prompt Tokens	您发送给模型的请求 Token 数（输入）
Completion Tokens	模型返回的响应 Token 数（输出）
Total Tokens	输入 + 输出

计费周期

按实际调用实时计费
每次调用后立即扣费并更新额度
额度不足时，API 返回 402 Payment Required 错误

定价规则

基础定价

Real200 的定价基于各供应商官方价格，通过渠道倍率进行调整。不同渠道可能享受不同的折扣。

智能路由定价

当启用智能路由时，Real200 会自动选择价格最优的可用供应商，无需手动比较。

:::tip 成本节省

通过智能路由，Real200 通常比直接使用官方 API 节省 15–30% 的成本。

:::

价格查询

您可以在以下方式查看实时价格：

控制台：登录 → 模型广场 → 查看每个模型的实时价格
API：GET /v1/models 返回每个模型的价格信息
文档：模型列表

额度管理

账户余额

每个账户有一个总余额（quota）
余额可通过充值增加
余额不足时，所有 API Key 的调用将被拒绝

Key 级别配额

可以为每个 API Key 设置独立的配额上限：

配额类型	说明
总额度	该 Key 生命周期内可消耗的最大金额
月度额度	该 Key 每月可消耗的最大金额
日额度	该 Key 每天可消耗的最大金额

设置配额

登录控制台
进入 API Keys 页面
编辑目标 Key
在配额设置中填写额度值
保存

额度不足处理

当 Key 配额或账户余额不足时：

{
  "error": {
    "message": "账户余额不足，请充值后继续使用。",
    "type": "insufficient_quota",
    "code": "insufficient_quota"
  }
}

此时 API 会返回 402 Payment Required 状态码。

对账与账单

调用日志

Real200 记录每次调用的详细信息，包括：

调用时间
使用的 API Key
请求/响应 Token 数
实际费用
供应商信息
延迟和状态码

账单导出

在控制台的日志页面，您可以：

按日期范围筛选
按 API Key 筛选
按模型筛选
导出为 CSV 格式

商家对账

对于需要给下游用户提供服务的商家：

支持按渠道（channel）独立对账
支持按用户独立统计
支持预付费余额系统（阈值提醒、冻结、自动扣费）

详见商家级计费指南。

常见问题

如何查看实时费用？

在控制台首页可以看到今日费用、Token 使用量和调用次数。在日志页面可以查看每次调用的详细费用。

流式响应如何计费？

流式响应与一次性响应的计费方式相同，按最终的 prompt_tokens + completion_tokens 计算。

失败调用是否计费？

如果请求未到达供应商（如被风控拦截、路由失败），不收取 Token 费用。

Token 数量和费用的换算关系？

Token 数量由模型的分词器（tokenizer）计算，不同模型的 Token 化方式不同。费用按实际 Token 数 × 单价计算，详见各模型的定价说明。

计费方式​

Token 说明​

计费周期​

定价规则​

基础定价​

智能路由定价​

价格查询​

额度管理​

账户余额​

Key 级别配额​

设置配额​

额度不足处理​

对账与账单​

调用日志​

账单导出​

商家对账​

常见问题​