AI Meter:开源 AI 用量监控

一个仓库,两条独立产品线:AI Balance 负责模型平台余额、credits 和请求级 token usage;AI Quota 负责 Codex / Claude Code 的 5 小时、每周订阅额度窗口。

AI Balance 模型平台余额与 token usage 查看阿里云百炼、DeepSeek、Kimi、豆包等 provider 余额,并把请求级 token 消耗按项目、模型、账号和资源归因。 查看产品页
AI Quota Codex / Claude 订阅额度窗口 查看 5 小时、每周 quota 剩余比例和重置时间,通过 iPhone、Apple Watch 和本机 bridge 保持独立展示。 查看产品页
AI Meter 产品概念图,展示 AI Balance 的 Web 看板、iPhone 余额应用、Agent 终端、平台余额、请求级用量和不保存 prompt 或 response 的边界。

AI Balance:余额和 token usage 的工作入口

服务端统一读取 provider 余额并接收 usage 事件,Web、macOS、iPhone 和 Agent 分别服务排查、提醒、确认和自动化场景。

AI Balance 回答账户还剩多少钱、哪次请求消耗 token;不处理 Codex / Claude 订阅额度窗口。

平台余额 接入 6 个余额或 credits 来源。
请求级 usage 按项目、模型、账号和资源聚合。
近 24h 观察 余额状态和 token 消耗同屏查看。
读写分权 查询 token 与 ingest token 分开。
Web Dashboard 概念图,展示用量筛选、token 趋势、项目排行和请求行明细。

Web Dashboard

用于排查 token 消耗来源:从余额总览进入 24h usage、项目排行和请求行明细,定位具体模型、账号和资源。

  • 余额、usage 趋势和请求明细同屏查看。
  • 按项目、模型、状态、账号和资源筛选。
  • 只记录结构化字段,不保存 prompt 或 response。
macOS Menu Bar 概念图,展示状态栏余额菜单、弹出菜单和桌面小窗。

macOS Menu Bar

把总余额、重点平台和近 24h 消耗放到菜单栏与桌面小窗里,写代码时不用反复打开多个控制台。

  • 菜单栏快速查看总余额和重点平台。
  • 桌面小窗保留低余额和近 24h 消耗上下文。
  • 客户端只读摘要,不持有云厂商 key。
iPhone App 余额监控真实界面截图,展示重点平台余额、总余额、近 24h 消耗和刷新按钮。
桌面小组件 ¥54.30 6 个平台 · 近 24h 消耗 ¥1.47
阿里云¥12.62 Kimi¥18.40 DeepSeek¥7.08
重点关注 ¥6.47 阿里云百炼 · 余额正常

iPhone App + Widget

移动端作为只读摘要入口,适合离开电脑前确认余额、重点平台和最近消耗风险。

  • 查看总余额、重点平台和近 24h 消耗。
  • 桌面小组件保留一眼可读的余额状态。
  • 设备端不保存云厂商 key。
Agent Skill 终端概念图,展示余额查询、打开看板、usage 上报和读写 token 分离。

Agent Skill

Agent 可以在命令行查询余额、打开看板,也可以在模型请求结束后上报 usage 事件,把消耗写回同一个服务。

  • 只读 token 用于余额查询和看板链接。
  • ingest token 用于写入 usage 事件。
  • 按项目、功能、账号、用户和资源维度聚合。
AI Quota · 订阅额度窗口

Codex / Claude Code 额度单独看

AI Quota 不看 provider 余额,也不算账单成本;它只看 Codex / Claude Code 这类订阅制工具的 5 小时、每周 quota 窗口。

  • 不和人民币、USD credits 或账单成本混算。
  • iPhone / Apple Watch 前台主动刷新,写代码前看一眼当前窗口。
  • 数据过期会明确提示,不伪装实时。
Apple Watch 表盘上的 Codex 额度入口,显示剩余额度和可能过期状态。
Apple Watch 订阅额度界面截图,显示 Codex 额度、5 小时剩余 92%、每周剩余 15% 和刚刚同步状态。

业务请求直连,usage 旁路上报

业务应用继续调用模型平台;请求结束后只把 token 数和业务维度写入 AI Balance 的 usage API。

不用代理模型流量,也能获得余额、近 24h 趋势和请求级成本线索。

Report-only:不代理流量,也能追踪 token 消耗

AI Balance 接收结构化 usage 事件,生成余额总览、趋势和请求明细;prompt 和 response 不进入监控链路。

1 直连 provider 业务应用照常调用模型平台 API。
2 写入 usage 请求结束后上报 token 与业务维度。
3 形成看板 聚合余额、趋势、项目排行和请求行。
4 处理异常 发现低余额、异常消耗或需要切换平台。
usage-event-demo.json
{
  provider: 'deepseek',
  model: 'deepseek-chat',
  project: 'class-teacher',
  tokens: 12003,
  storedPrompt: false
}

监控结果

看板把结构化事件转成余额总览、趋势指标和请求列表。

¥54.30 余额
5,290 tokens
0% 失败率
class-teacher 2 次请求 4,120

隐私边界

storedPrompt: false storedResponse: false

云厂商 key 留在服务端。

请求链路保持直连 监控服务不代理模型调用,不改变现有业务请求路径。
事件字段用于成本定位 provider、model、token、项目、账号、用户和资源字段用于聚合分析。
内容数据不写入监控库 prompt 和 response 不作为 usage 字段保存。

已接入的平台余额来源

当前接入服务端可读取的官方余额或 credits 接口,用于查看可用金额、币种来源和低余额风险。

OpenAI、Claude、Gemini 可通过 usage/cost 事件进入用量分析;Codex / Claude Code 订阅窗口属于 AI Quota,不并入余额矩阵。

阿里云百炼 QueryAccountBalance · CNY
DeepSeek /user/balance · 按币种展示
火山引擎 / 豆包 QueryBalanceAcct · CNY
Kimi / Moonshot /v1/users/me/balance · CNY
SiliconFlow /v1/user/info · CNY
OpenRouter /api/v1/credits · USD
余额、credits、账单成本、usage 和 quota 是不同账务口径。AI Balance 会保留来源与币种,帮助你判断哪些平台需要充值、哪些项目正在消耗 token。

只记录成本字段,不接收内容

AI Meter 只需要定位成本和额度状态所需的结构化字段;业务 prompt、response 和 provider key 不进入客户端。

prompt / response 不入库 只保存 provider、model、token 数、项目、账号、用户、资源和时间戳。
provider key 留在服务端 Web、macOS、iPhone 和 Agent 客户端不需要持有阿里云、DeepSeek 等 provider key。
查询与写入分权 只读查询 token 用于余额查询;ingest token 用于 usage 上报。
report-only 写入 隐私边界
业务请求 App 或 Agent 直接调用模型平台。
结构化 usage provider、model、项目、账号、资源和 token 数。
成本观察 余额查询和 usage 行,与 provider key 隔离。
{ "storedPrompt": false, "storedResponse": false, "providerKeys": "server-side" }
不存 prompt 不存 response 不下发 key

本地几分钟跑起来

克隆仓库,复制 `.env.example`,配置实际使用的 provider key,然后启动 Web Dashboard 或 macOS 菜单栏应用。

没有 key 时也可以查看界面结构和 demo 数据;接入真实平台后再切换到自己的余额与 usage。

terminal
git clone https://github.com/pan609/token-balance-monitor.git
cd token-balance-monitor

cp .env.example .env
./scripts/install-deps.sh

# Web dashboard
./start.command

# macOS menu bar / desktop pet
./pet.command
Web Dashboard 查看 provider 状态、余额总览、usage 趋势和最近请求。
Agent 接入 只读 token 查询余额;ingest token 上报 usage 事件。接口契约见 API Reference。
AI Quota Codex / Claude Code 额度走独立 quota API,可在 iPhone 和 Apple Watch 前台确认新鲜度。
MIT License 可自托管部署,也可按 provider 适配器二次扩展。

会保存 prompt 或 response 吗?

不会。Usage 事件只保存 provider、model、token 数、项目、账号、用户、资源和时间戳。

AI Balance 支持哪些余额来源?

阿里云百炼、DeepSeek、豆包、Kimi、硅基流动和 OpenRouter;币种与来源会保留原始口径。

OpenAI、Claude、Gemini 怎么接?

更适合作为 usage/cost 事件进入分析,和预付余额不是同一类账务数据。

AI Quota 和 AI Balance 是一回事吗?

不是。AI Balance 看 provider 余额和 token usage;AI Quota 看 Codex / Claude Code 的订阅额度窗口。

可以公开部署吗?

可以自托管,但公开 Web 看板前建议加 HTTPS 和访问控制。

按你的场景选择 AI Balance 或 AI Quota。

打开 GitHub 仓库,配置余额、usage 或 quota 所需的 token,再按需要启用 Web、macOS、iPhone、Apple Watch 或 Agent 入口。