模型平台余额与 token 用量监控

AI Balance 面向同时使用多个模型平台的开发者和团队:统一查看阿里云百炼、DeepSeek、Kimi、豆包、硅基流动、OpenRouter 的余额或 credits,并把请求级 token 消耗按项目、模型、账号和资源归因。

AI Balance Web Dashboard,展示余额总览、token 趋势、项目排行和请求明细。 AI Balance iPhone App,展示重点平台余额和总余额。

余额、usage 归因、隐私边界

余额、请求消耗和隐私边界是 AI Balance 的核心。它不处理 Codex / Claude Code 的订阅额度窗口,那部分属于 AI Quota。

账户里还剩多少钱? 按 provider 和币种展示余额或 credits,避免把不同账务口径强行合计。
谁在消耗 token? 业务服务在模型请求结束后上报 usage 事件,看板按项目、模型、账号、用户和资源聚合。
哪些数据不会进入监控? prompt、response 和云厂商 key 不进入客户端;usage 只保存排查成本需要的结构化字段。

同一套服务,多个工作入口

Web 看板负责排查,macOS 菜单栏负责提醒,iPhone Widget 负责离开电脑前确认,Agent Skill 负责自动化查询和上报。

Web Dashboard 余额总览、近 24h token 趋势、项目排行和请求明细。
Agent Skill Agent 使用只读 token 查询余额,用 ingest token 上报 usage。
macOS Menu Bar 把总余额、重点平台和近 24h 消耗放到菜单栏与桌面小窗。
iPhone App / Widget 移动端只读查看余额摘要,桌面小组件保留一眼可读状态。
API Reference 读写 token 分权,支持服务端集成和自动化脚本接入。
Provider Matrix 记录哪些平台是余额、credits、账单成本或 usage 口径。

业务请求不经过代理,usage 旁路上报

业务应用继续直连模型平台。请求完成后,只把 provider、model、token 数和业务维度写入 AI Balance。

适合已有业务系统 不需要改成统一网关,也不要求模型请求经过监控服务。
适合 Agent 工作流 Agent 可以查询余额状态,用于决定是否继续执行长任务或提醒充值。
usage-event-demo.json
{
  provider: "deepseek",
  model: "deepseek-chat",
  project: "class-teacher",
  tokens: 12003,
  storedPrompt: false,
  storedResponse: false
}

已支持的余额或 credits 来源

AI Balance 优先适配官方、稳定、服务端可调用的接口。OpenAI、Claude、Gemini 更适合通过 usage/cost 事件进入分析,不会被包装成“余额”。

阿里云百炼QueryAccountBalance · CNY
DeepSeek/user/balance · 按币种展示
火山引擎 / 豆包QueryBalanceAcct · CNY
Kimi / Moonshot/v1/users/me/balance · CNY
SiliconFlow / 硅基流动/v1/user/info · CNY
OpenRouter/api/v1/credits · USD

常见问题

AI Balance 和 AI Quota 是一回事吗?

不是。AI Balance 看模型平台余额和 token usage;AI Quota 看 Codex / Claude Code 的订阅额度窗口。

需要公开部署 Web 看板吗?

不一定。可以只在内网或本机使用;如果公开部署,建议加 HTTPS 和访问控制。

可以不配置所有 provider 吗?

可以。只配置你实际使用的平台,其他 provider 不会影响看板运行。

把余额和 token usage 看清楚。

从 GitHub 克隆仓库,配置 provider key 和只读 token,再按需要启用 Web、macOS、iPhone 或 Agent 入口。