資料源:raicvat#12「hatch」project (168 tasks / ~3125 frames,中油 / siemens / jujia 工地)
safety_rope_use attribute (3 態 select)。LLM 預標 + 人工抽查 → 訓練擴大 crop binary classifier。
| 項目 | 說明 |
|---|---|
| 判斷單位 | 每個 person(從原圖偵測得到) |
| 輸出 | 三態 select:correct 正確使用|wrong 錯誤使用(沒戴/拿手上/沒掛勾)|unknown 非高處作業 / 鏡頭遠看不清 |
| 資料源 | raicvat#12 168 tasks ~3125 frames(中油 / siemens / jujia) |
| 樣本量預估 | ~3125 frames × avg 1-2 人/frame = ~3000-6000 person bbox |
安全繩會從 person 身上 延伸到結構物(horizontal lifeline、scaffold、anchor point),標準 person bbox 切不到 anchor 端。
YOLO person detect → 擴大 bbox 1.0× → resize 384×192 → 分類器
整張圖過 backbone 一次 → 對 expanded bbox 做 RoI Align → MLP 分類
不要污染現有 project 5(factory_ppe)或 project 7(hatch),新開 project 8:
cvat2 project 8: safety_rope
labels:
- person (rectangle)
+ safety_rope_use:
type: select
values: [unknown, correct, wrong]
default: unknown
| 位置 | 說明 |
|---|---|
/mnt/ssd/cvat2/data/cvat_share/external_datasets/hatch_p12/task_*/frame_*.jpg | 剛剛 hatch pipeline 已下載 168 tasks 的圖到 cvat_share |
3 個 cvat2 task(沿用 raicvat#12 subset):
| task | subset | frames |
|---|---|---|
| safety_rope_part01of03 | Train | 1,305 frames |
| safety_rope_part02of03 | Validation | 663 frames |
| safety_rope_part03of03 | Test | 1,157 frames |
raicvat#12 沒 person 標註,要自動生成:
注意:YOLO 偵測可能漏(small / 遮擋),但工地高處作業多有大尺寸 person,預期準度足夠。
對下列 person crop(已含周圍上下文)判斷高處作業安全繩使用: - correct: 繩子掛勾固定到結構/lifeline 上 - wrong: 沒繩、繩拿在手上、繩掛在自己身上、沒掛勾 - unknown: 非高處作業 / 鏡頭遠看不清 / 沒看到繩 回單字: correct / wrong / unknown
跟現有 PPE 21 attr classifier 解耦,因為:
safety_rope_classifier: backbone: mobilenetv3_large_100 (pretrained, ~4M params) head: nn.Linear(1280, 3) # 3-cls softmax: correct/wrong/unknown loss: CrossEntropyLoss (only on labeled samples) input: person crop expanded (CROP_PAD=1.0), 384×192, ImageNet normalize 部署: ppe_service stage 3 Stage 1: person_seg YOLO → person bbox Stage 2: PPE 21-attr classifier (現有 v20260501) Stage 3: safety_rope_classifier (新) for each person: stage 2 output 21 attrs + stage 3 output rope_use 3-cls
| 步驟 | 內容 | 預估 |
|---|---|---|
| 1 | 等 hatch pipeline 完(168 tasks 下載完,圖已在 cvat_share) | 跑中 |
| 2 | cvat2 創 project 8 「safety_rope」(person rect + safety_rope_use attr) | 5 min |
| 3 | 跑 YOLO11n person detect 對 3125 frames,生 person bbox | 10 min |
| 4 | 上傳 3 個 cvat2 task(含 person bbox annotation) | 10 min |
| 5 | LLM (Gemini Flash) 預標 safety_rope_use(~5k crops) | 30 min |
| 6 | review tool 加 attribute 顯示 + 人工抽查 | 1-2 hr |
| 7 | export manifest + 訓 v20260502_safety_rope | 40 min |
| 8 | HTML report + R2 + Pages | 10 min |
總工時:~3-4 小時(不含人工 spot check)
生成 2026-04-27 v2 (raicvat#12 only)| v20260501 model| label guide| 舊版 (raicvat_p17)