精枢·LeanHub评测中心
集群健康7/7 在线
管
管理员
平台运维
评测中心
模型评测全流程管理 · 数据集管理 · 在线评测 · 结果对比分析
2026-06-05
评测数据集管理
数据集名称领域样本数创建时间操作
工业缺陷检测评测集 V2视觉检测12,5002025-05-28
设备故障诊断问答集故障诊断8,3202025-05-20
工业知识图谱 QA 基准知识图谱5,6002025-05-15
生产排程优化测试集生产优化3,8002025-05-10
工业安全合规评估集安全合规2,1002025-04-28
评测任务列表
评测名称目标模型数据集状态进度创建时间
缺陷检测 V2 全量评测Qwen2-VL-72B工业缺陷检测评测集 V2已完成
2025-06-03
故障诊断能力评估DeepSeek-R1-67B设备故障诊断问答集进行中
2025-06-04
知识图谱 QA 对比评测Qwen2-72B工业知识图谱 QA 基准已完成
2025-05-30
生产排程优化对比测试Yi-Large-34B生产排程优化测试集排队中
2025-06-04
安全合规综合评测Qwen2-72B工业安全合规评估集已失败
2025-06-02
在线评测
Qwen2-72B|推理耗时 1.2s|Token 计数 248
通过视觉检测系统识别产品表面缺陷,常见方法如下:
1. 划痕缺陷检测
利用高分辨率工业相机拍摄产品表面图像,通过边缘检测算法(如Canny算子)提取纹理特征,结合形态学处理识别线性划痕。适用于金属、玻璃、塑料等材质表面的连续性划痕检测。
2. 气泡/砂眼缺陷检测
采用背光照明方式增强缺陷对比度,通过灰度阈值分割算法分离出圆形或椭圆形的暗斑区域。配合面积和圆度筛选过滤噪声,适用于注塑件、铸件、涂层表面。
3. 脏污/油渍缺陷检测
使用多光谱成像或偏振光照明,通过分析RGB通道的反射差异,结合深度学习语义分割模型(如U-Net)进行像素级分类。适用于食品包装、电子元器件、精密零件等场景。
以上为参考回答,实际评测将依据数据集的标注答案进行评分。
评测结果对比
Qwen2-72BDeepSeek-R1-67B|基于:工业知识图谱 QA 基准
准确率 (Accuracy)
87.2%
Qwen2-72B
91.5%
DeepSeek-R1-67B
召回率 (Recall)
83.6%
Qwen2-72B
88.9%
DeepSeek-R1-67B
F1 分数
85.3%
Qwen2-72B
90.1%
DeepSeek-R1-67B
BLEU 分数
42.8
Qwen2-72B
48.6
DeepSeek-R1-67B
综合胜出模型
DeepSeek-R1-67B
平均准确率
89.4%
平均 F1
87.7%
评测样本总量
5,600 条
评测报告导出
一键导出完整的评测结果报告,支持多种格式,方便归档与分享
最近生成的报告
工业知识图谱 QA 评测报告_202506042025-06-04 14:23
缺陷检测 V2 全量评测报告_202506032025-06-03 18:45
故障诊断能力评估报告_202506022025-06-02 09:12