2026-06-10 16h 準度研究產出 · cvat #11 · manifest_v608(資料與 v20260608 完全相同, 純訓練配方升級)
| 項目 | 值 |
|---|---|
| Backbone | mobilenetv3_large_100.ra_in1k(timm, 4.2M params, 2 binary heads + partial-label mask) |
| 訓練 imgsz | 512(v608: 384) |
| 推論 imgsz | 512(train/infer 一致, 非 cascade 小目標模型, 不適用規則16 的 1280 強制) |
| Aug | strong(v608: none)— RandomResizedCrop/flip/affine/ColorJitter/erase |
| 其他 | batch 48 / epochs 20 (early stop ep9) / lr 3e-4 / wd 0.01 / patience 6 / BCE+pos_weight |
| Dataset | manifest_v608: train 16,037 / val 3,908 / test 2,655(task subset 切分, 同 v20260608 零變動) |
| 訓練 script | train_hatch_v2.py r16h_512aug --img-size 512 --aug strong(5090-2, ~25 min 單卡) |
| model | has_open AP | has_close AP | mAP | thr 校準 |
|---|---|---|---|---|
| v20260608(production) | 0.9929 | 0.9704 | 0.9817 | close 病態 thr=0.001 |
| img512(消融: 只加解析度) | 0.9950 | 0.9733 | 0.9842 | 正常 |
| aug(消融: 只加 aug) | 0.9703 | 0.9878 | 0.9746 | — |
| 512aug(本版) | 0.9956 | 0.9901 | 0.9929 | open 0.5 / close 0.7(F1 0.967 / 0.952) |
| 512aug seed2(重現驗證) | 0.9918 | 0.9937 | 0.9928 | — |
兩個變因各自只救一頭(512→open、aug→close)且 aug 單獨會傷 open;合併後同時取兩者增益。
| 項目 | 值 |
|---|---|
| ckpt | door_state_v20260610.pt(R2 door_state_v20260610/best.pt · 5090-2 ~/factory_ppe/runs/hatch_r16h_512aug/best.pt) |
| ppe-demo register | door_state_v610(與 door_state(v518) 並列觀察) |
| 建議工作點 | open thr 0.5 / close thr 0.7(test F1-opt; ckpt 內存 val 校準 thr 0.385/0.371 偏舊勿用) |
| 注意 | 512 推論成本約 384 的 1.75×(mobilenetv3 4.2M 絕對值仍小);鐵網閘門場景(電梯井)的 close 誤報為已知限制 |
出處:16h 自主準度研究 2026-06-10(accuracy_research_v20260610_report)· 同集對照 dump/分析腳本 5090-2 ~/factory_ppe/scripts/r16h/