精枢·LeanHub运营工作台
集群健康7/7 在线
管
管理员
平台运维
运营工作台
平台总览看板 · 实时掌握模型服务运行状态
2025-06-05
活跃模型数
+212
总计 18 个模型 · 12 在线 · 1 异常
今日调用量
+12%482,591
较昨日 ↑ 12.3% · 峰值 35,200 次/时
告警数
需关注3
未处理 2 条 · 今日新增 1 条
部署实例数
+124
GPU节点 8 个 · 总显存占用 76%
模型调用量实时曲线
50k40k30k20k10k0
00:0002:0004:0006:0008:0010:0012:0014:0016:0018:0020:0022:0024:00
告警事件
查看全部严重Qwen2-72B 响应超时
连续 3 次健康检查失败 · 已持续 12 分钟
2025-06-05 14:23:15
警告GPU 资源使用率超限
节点 gpu-node-c1 使用率 92% · 建议扩容
2025-06-05 13:45:02
警告API 网关请求延迟升高
P99 延迟 1.2s · 超出告警阈值 800ms
2025-06-05 12:30:18
信息DeepSeek-V3 部署完成
已分配 4 节点 · 正在处理流量预热
2025-06-05 11:15:40
已处理模型缓存命中率下降
已触发自动扩容策略 · 已恢复正常
2025-06-05 10:00:00
最近部署任务
查看全部模型名称版本节点数状态
Qwen2-72B-Instruct
v1.2.04完成
DeepSeek-V3
v2.0.14部署中
ChatGLM4-9B
v3.5.02完成
Mistral-7B
v1.8.00失败
LLaMA-3-70B
v1.0.00待部署
资源利用概览
70%
CPU 利用率
已用 12.6/18.0 核 · 趋势 ↑
80%
内存利用率
已用 51.2/64.0 GB · 趋势 ↑ 需关注
60%
GPU 利用率
已用 38.4/64.0 GB · 趋势 → 平稳