👷 PPE 27-attr NV v20260618 — 對照記錄(判定不上版)
MobileNetV3-L · 22 attr + 5 visibility(NV) head · partial-label BCE · cvat #12 全資料重訓(含 6/18 HSINTUNGYANG/IRODA 新標)
結論:不上 production,通用版維持 v20260610_nv。
納今天新標的全資料重訓未帶來進步,反而稀釋稀有 attr:同一 test 集 macro mAP(排NV) 0.9626 → 0.9349(−0.028),hair_cover/sleeves 嚴重退步。
此為「全資料重訓稀釋稀有 attr」第三次實證(前兩次 v616b/v616c)。本報告僅作決策對照記錄。
📊 三版同 test 集對照(17,085 crops,三模型推論同一批)
| attr | n | v610_nv(現役) | v616c | v618_nv(新) | Δ v618 vs v610 |
| macro mAP(排 NV) | — | 0.9626 | 0.9439 | 0.9349 | −0.0277 |
| hair_cover | 2076 | 0.8458 | 0.6777 | 0.4297 | −0.416 🔴 |
| sleeves | 2088 | 0.9832 | 0.7552 | 0.7597 | −0.224 🔴 |
| heartbeat | 3802 | 0.8773 | 0.8733 | 0.8354 | −0.042 🔴 |
| safety_shoes | 1962 | 0.9532 | 0.9465 | 0.9219 | −0.031 🔴 |
| fall | 2464 | 0.9764 | 0.9680 | 0.9714 | −0.005 |
| cotton_gloves | 2223 | 0.7705 | 0.7546 | 0.8552 | +0.085 🟢 |
| harness | 13106 | 0.9006 | 0.9216 | 0.9219 | +0.021 🟢 |
| safety_glasses | 1879 | 0.9591 | 0.9416 | 0.9662 | +0.007 🟢 |
| hard_hat | 7079 | 0.9931 | 0.9942 | 0.9943 | +0.001 |
其餘 attr(no_head_protection / face_mask / gloves / clothing / shoes 等)三版皆 ≥0.98 持平,省略。NV head 不計入 macro(單鏡頭 leak,另議;safety_vest_nv 仍 0.25 不可用)。
🎯 hard_hat 場域 KPI @R90(規則 3.5)
| 模型 | P | FP | TP | FN |
| v610_nv(現役) | 0.991 | 31 | 3357 | 373 |
| v618_nv(新) | 0.992 | 28 | 3357 | 373 |
hard_hat 持平(同 recall,FP 31→28 無顯著差),不是退步來源。退步集中在稀有 attr。
📦 訓練 stack
- Backbone:MobileNetV3-L(4.24M params)
- 架構:27 head(22 attr + 5 visibility NV)· partial-label BCE(unknown mask=0)· per-attr pos_weight · aug strong + mixup 0.2
- Hyperparams:40 ep / patience 16(2026-06-11 標準)/ batch 128 / AdamW lr 3e-4 wd 0.01 — best ep39(early stop)
- 訓練 imgsz:384×192 推論 imgsz:384×192(person crop,cascade 上游 person YOLO26m@1280)
- Dataset:cvat #12 全資料 195,648 crops(train 149,222 / val 29,341 / test 17,085),含 6/18 HSINTUNGYANG-AI 多鏡頭 + IRODA 新標
- v618 自身 test(不同集,僅參考):test_mAP 0.9183 / macro_F1 0.9096
📝 根因 + 建議
- 根因:今天新標增量極少且多在 val/test,全資料重訓把 hair_cover(全集僅 185 pos)/sleeves 等稀有 attr 稀釋;與零星新標重訓多持平/退步、全資料重訓稀釋稀有 attr 的歷史教訓一致。
- 通用 production 維持 v20260610_nv 不動。
- 可救的:cotton_gloves(+0.085)/harness(+0.021) 確有進步——若特定場域吃這兩個 attr,建議仿 forklift_ppe_v616b 走場域專用版,不污染通用版。
- 方法論註記:本次洩漏排除(v610/v616c train)因跨版本 crop 檔名不同未生效,test=全 17,085;三模型推論同一批,head-to-head Δ 有效,但 v610/v616c 絕對值若有 train frame 漏入 test 會偏樂觀——即便如此 v618 仍未超越,結論穩固。