精枢·LeanHub运营工作台

集群健康7/7 在线

管

管理员

平台运维

运营工作台

平台总览看板 · 实时掌握模型服务运行状态

2025-06-05

活跃模型数

总计 18 个模型 · 12 在线 · 1 异常

今日调用量

+12%

482,591

较昨日 ↑ 12.3% · 峰值 35,200 次/时

告警数

需关注

未处理 2 条 · 今日新增 1 条

部署实例数

GPU节点 8 个 · 总显存占用 76%

模型调用量实时曲线

50k40k30k20k10k0

00:0002:0004:0006:0008:0010:0012:0014:0016:0018:0020:0022:0024:00

告警事件

查看全部

严重Qwen2-72B 响应超时

连续 3 次健康检查失败 · 已持续 12 分钟

2025-06-05 14:23:15

警告GPU 资源使用率超限

节点 gpu-node-c1 使用率 92% · 建议扩容

2025-06-05 13:45:02

警告API 网关请求延迟升高

P99 延迟 1.2s · 超出告警阈值 800ms

2025-06-05 12:30:18

信息DeepSeek-V3 部署完成

已分配 4 节点 · 正在处理流量预热

2025-06-05 11:15:40

已处理模型缓存命中率下降

已触发自动扩容策略 · 已恢复正常

2025-06-05 10:00:00

资源利用概览

70%

CPU 利用率

已用 12.6/18.0 核 · 趋势 ↑

80%

内存利用率

已用 51.2/64.0 GB · 趋势 ↑ 需关注

60%

GPU 利用率

已用 38.4/64.0 GB · 趋势 → 平稳

新建部署

选择模型并配置部署参数，快速启动服务

导入模型

上传或从 HuggingFace 导入新模型

创建评测

选择数据集和模型，开始评测任务

查看文档

API 文档、SDK 使用指南及最佳实践