精枢·LeanHub模型监控
集群健康7/7 在线
管
管理员
平台运维
模型监控
全维度监控面板 · 实时掌握模型运行状态与性能指标
Tokens 消耗曲线
近24小时 · 每5分钟采样
输入 Tokens
输出 Tokens
总量
00:0002:0004:0006:0008:0010:0012:0014:0016:0018:0020:0022:00现在
400K300K200K100K0
P50 延迟
-5.2%124ms
较昨日 ↓12ms
P90 延迟
+2.8%387ms
较昨日 ↑8ms
P99 延迟
+1.5%1.2s
较昨日 ↑15ms
模型错误率
4.7%总错误率
成功92.1%
超时/限流3.2%
服务错误4.7%
24h 请求总量24,563,847
错误总数1,154,501
平均响应时间236ms
节点资源监控
查看全部节点节点名称CPU内存GPU状态操作
model-server-a1
45%
62%
38%
在线
model-server-b2
78%
81%
72%
在线
gpu-node-c1
92%
88%
95%
高负载
inference-d1
32%
45%
28%
在线
batch-e1
12%
25%
8%
在线
告警规则配置
当前已配置 8 条告警规则 · 2 条触发中