精枢·LeanHub模型监控
集群健康7/7 在线
管理员
平台运维

模型监控

全维度监控面板 · 实时掌握模型运行状态与性能指标

Tokens 消耗曲线

近24小时 · 每5分钟采样

输入 Tokens
输出 Tokens
总量
00:0002:0004:0006:0008:0010:0012:0014:0016:0018:0020:0022:00现在
400K300K200K100K0
P50 延迟
-5.2%
124ms
较昨日 ↓12ms
P90 延迟
+2.8%
387ms
较昨日 ↑8ms
P99 延迟
+1.5%
1.2s
较昨日 ↑15ms

模型错误率

4.7%总错误率
成功92.1%
超时/限流3.2%
服务错误4.7%
24h 请求总量24,563,847
错误总数1,154,501
平均响应时间236ms

节点资源监控

查看全部节点
节点名称CPU内存GPU状态操作
model-server-a1
45%
62%
38%
在线
model-server-b2
78%
81%
72%
在线
gpu-node-c1
92%
88%
95%
高负载
inference-d1
32%
45%
28%
在线
batch-e1
12%
25%
8%
在线

告警规则配置

当前已配置 8 条告警规则 · 2 条触发中