📦 模型下載：https://pub-478929a98a5c440cb22c2241c0bde314.r2.dev/vehicle_seg/best.pt

🚗 vehicle_seg — YOLO26n 偵測評估報告

cvat2 #23 · 5-class (car/truck/bus/motorcycle/bicycle) · polygon seg → bbox · 2026-06-24

0.460

val mAP@50

0.320

val mAP@50-95

0.615

test mAP@50

類別

2.38M

參數

⚠️ 結論先講：整體 val mAP@50 = 0.460 偏低，主要瓶頸是漏框（recall 不足）非誤報——即使 conf 拉到 0.05，val recall 上限也只到 0.599。bicycle 基本失敗（AP 0.142）。不建議直接上 production，定位為 baseline / PoC，改善方向見文末。

1. 資料集

split	images	bbox	密度/img
train	23,725	217,170	9.2
val	2,239	39,230	17.5
test	27	361	—（小，主評估靠 val）

per-class GT (val)：car 22900, truck 1965, bus 1415, motorcycle 10578, bicycle 2372。
SAM3 subset 16 task 按比例分入 train/val（13/3）；Test 內 3 個 500-frame 未標 task（5835/36/37）已排除。

2. Hyperparams

項目	值
base weight	yolo26n.pt (YOLO26n, 2.38M params)
訓練 imgsz / 推論 imgsz	640 / 640
epochs / patience	100 / 30（跑滿 100）
batch / device	64 / 單卡 RTX5090
optimizer	auto → MuSGD (lr0 0.01)
aug	mosaic(close@10) + fliplr 0.5（YOLO det 標準）
shape→bbox	polygon 外接框 + rectangle，5-class

3. Per-class 結果

val（2239 img）

類別	AP@50	AP@50-95	P	R
car	0.691	0.505	0.754	0.633
truck	0.440	0.322	0.629	0.392
bus	0.674	0.537	0.810	0.610
motorcycle	0.354	0.168	0.609	0.316
bicycle	0.142	0.068	0.494	0.117

test（27 img，樣本小僅供參考）

類別	AP@50	AP@50-95	P	R
car	0.840	0.599	0.818	0.751
truck	0.593	0.455	0.510	0.429
bus	0.742	0.471	0.795	0.557
motorcycle	0.739	0.390	0.657	0.629
bicycle	0.161	0.031	0.306	0.333

car/bus 尚可（AP50 ~0.68），truck/motorcycle 中等、bicycle 崩（R 0.12）。

4. 誤報 / 漏報分析（det SOP）

4.1 P@固定recall + FP 絕對數（場域 KPI）

recall 上限只有 0.599：掃遍所有 conf 都達不到 R≥0.90。最低 conf=0.05 時 R=0.599 / P=0.387 / FP=37274 / FN=15731。~40% 的車輛根本沒被偵測到（漏框），這是首要瓶頸。

4.2 conf 掃描（P↔R↔FP 取捨）

conf	P	R	TP	FP	FN
0.05	0.387	0.599	23499	37274	15731
0.15	0.665	0.519	20372	10254	18858
0.25	0.797	0.468	18369	4680	20861
0.35	0.876	0.424	16640	2350	22590
0.50	0.939	0.361	14165	925	25065
0.70	0.972	0.281	11030	324	28200

精度可靠拉 conf 換到（conf 0.5 → P 0.94），但代價是 recall 掉到 0.36。場域用建議 conf≈0.25（P 0.80 / R 0.47 / FP 4680，藍底列）。

4.3 FP 按類別拆解（conf 0.05）

類別	FP 數	GT 數
car	20620	22900
truck	1654	1965
bus	695	1415
motorcycle	11773	10578
bicycle	2532	2372

car/motorcycle 的 FP 最多（各 ~2万/1.2万）——與密集街景小目標、實例重疊有關。

4.4 train vs val gap（過擬合判斷）

train mAP@50 = 0.664 ／ val mAP@50 = 0.460 ／ gap = 0.204
gap > 0.15 有中度過擬合，但 train 本身也只 0.664（沒把訓練集背起來）→ 屬「欠擬合 + 中度過擬合混合」：模型容量/資料品質雙重受限，單純加資料邊際有限。

4.5 類間混淆 + PR 曲線

5. 根因 + 改善建議

小目標漏框（首要）：motorcycle/bicycle 在街景遠景像素少，640 解析度抓不到 → 改 imgsz 1280 重訓最可能救 recall（代價訓練/推論慢 2-4×）。
bicycle 近乎失敗（AP 0.14）：2372 GT 但 R 0.12，疑似標註稀疏/與 motorcycle 混淆 → 查 confusion matrix + 補標 / 加權。
標註品質：polygon→bbox 對密集重疊車流外接框可能不準；GT 若漏標會同時壓低 P（真檢被當 FP）與 R 上限 → 抽樣人工 audit。
SAM3 半自動標：16 task 混入 train/val，品質待驗 → 可做「含/不含 SAM3」A/B。
中度過擬合 → close_mosaic 提早 / 加 mixup / 或更大 backbone（26s/26m）。

下一步建議：先跑一版 imgsz 1280 對照（同資料同 backbone，純比尺度），若 recall 明顯回升再考慮 backbone 升級與 bicycle 補標。本版 best.pt 保留為 640 baseline。

YOLO26n · 訓練 2.36h · 100 epoch · RTX5090 單卡 · 報告自動生成 2026-06-24