👷 PPE 小物件辨識能力 — 升解析 vs head-ROI 實驗

針對「頭部小屬性(安全眼鏡/口罩/hair_cover 等)辨識不佳」· 資料 RAIVISION (DAVIDMAC 場域, 12k crop) · 單變因對照

結論:升解析(384×192→512×256)與 head-ROI 皆明顯改善頭部小屬性;建議走「hires 512×256」單一模型。
頭部小屬性 macro AP:baseline 0.9678 → hires 0.9879(+0.020)→ headroi 0.9904(+0.023)。兩者接近,但 hires 是單一全身模型(保留所有屬性),headroi 只吃頭肩需雙分支架構、非頭部屬性失效。

三方對照(RAIVISION test 1,257 crop,各用自身前處理)

頭部小屬性baseline 384×192hires 512×256headroi (TopCrop+320²)
頭部小屬性 macro0.96780.98790.9904
safety_glasses(最小)0.93560.99150.9907
full_face_mask0.94941.00001.0000
face_mask0.98331.00000.9929
face_mask_nv0.94140.96370.9782
helmet_goggles0.99831.00001.0000
hard_hat0.99500.99991.0000
safety_glasses_nv0.97160.96050.9710

最難的小件提升最大:safety_glasses +0.056、full_face_mask +0.051、face_mask_nv +0.037。

三版設定

版本輸入前處理覆蓋屬性ckpt
baseline(現役限縮)384×192全身 crop resize全 27 attrfactory_ppe_v20260702_raivision
hires ⭐512×256全身 crop resize全 27 attrfactory_ppe_v20260703_rai_hires
headroi320×320TopCrop 上45%(頭肩)+resize僅頭部屬性有效factory_ppe_v20260703_rai_headroi
⚠️ 兩個 caveat:

建議

兩實驗版已上 ppe-demo 並列(ppe22_rai_hires / ppe22_rai_headroi)供實測。

→ 所有報告目錄