訓練日期 2026-06-01 · 5090-2 GPU1 · YOLO26s · 大 backbone + 高解析(場域遠景小目標)· cvat #1
把 person 偵測器從 YOLO26n@640 升成 YOLO26s@1280(大 backbone + 高解析)。test mAP50 0.690 → 0.825、mAP50-95 0.473 → 0.637。場域驗證遠景小目標偵測率比 v527 高 60~90%,且 conf 0.25 無 FP。已成為所有 cascade(person / ppe22 / forklift_ppe / safety_rope / age_gender / ppe_color)的 person 偵測器。
| 模型 | backbone | 訓練 imgsz | 推論 imgsz | test mAP50 | mAP50-95 |
|---|---|---|---|---|---|
| person v527(前) | YOLO26n | 640 | 1280 | 0.690 | 0.473 |
| person yolo26s@1280 ⭐ | YOLO26s | 1280 | 1280 | 0.825 | 0.637 |
ep91 best:P 0.883 / R 0.734。
對代表場域影片掃 conf 0.10/0.15/0.25/0.35(推論 imgsz 1280),以「小框數」(框面積<影格 0.5%) 為遠景偵測力代理:
| conf | yolo26s 小框(戶外/室內) | v527 小框(戶外/室內) |
|---|---|---|
| 0.10 | 1683 / 732 | 981 / 486 |
| 0.15 | 1514 / 685 | 841 / 433 |
| 0.25 ⭐ | 1307 / 625 | 684 / 387 |
| 0.35 | 1169 / 594 | 578 / 352 |
遠景小目標偵測率 yolo26s 比 v527 高 90%(戶外)/ 60%(室內),同 conf。肉眼審查 conf 0.15 多抓的框全是真人(遠景/遮擋/群聚),兩支影片皆無 FP。
yolo26s 是 imgsz1280 較大模型、confidence 分布跟 v527 不同。沿用 0.35 會白丟戶外 ~140 / 室內 ~30 個遠景小框。0.25 已涵蓋遠景小人且有 FP 安全裕度(連 0.15 都無 FP)。所有 cascade 已設 default_person_conf=0.25。
cascade_det_imgsz(yolo, floor) = max(ckpt 訓練 imgsz, floor) # person floor=1280:訓 640 的舊模型→1280;訓 1280 的 yolo26s→1280;未來訓 1536→自動 1536
YOLO ckpt 存得到訓練 imgsz(overrides["imgsz"])。換 person 模型只要丟 ckpt,cascade 推論 imgsz 自動對,不會重蹈 v530「自動讀成 640 漏遠景人」。
person_yolo26s_v20260601_1280/best.pt ⬇(20.4 MB,訓練 imgsz 1280)