YOLO 物件偵測實作

YOLO11s Fine-tuning 與桌球賽事分析

作業簡介

本專案旨在透過標記 100 張桌球賽事圖片作為訓練集，對 YOLO11s 預訓練模型進行 Fine-tuning。重點在於提升模型對特定場景物件（如球桌、球員、球拍及高速移動的球）的辨識能力，並透過參數調校解決小物件偵測困難的問題。

使用技術 / 環境

Language: Python 3.9
Pre-trained Model: YOLO11s (Ultralytics)
Dataset: 100 張標記圖片 (桌球賽事場景)
Labeling Tool: labelImg

方法與流程 (Methodology)

1. 資料標記 (Data Labeling)

使用 labelImg 對 100 張原始影像進行手動標記，定義類別包括球員、裁判、球桌、球拍以及球。標記品質直接影響模型收斂效果。

2. 資料增強與參數調校 (Augmentation & Tuning)

本專案的關鍵挑戰在於小物件 (Small Objects) 的偵測，如乒乓球與球拍。由於球速極快導致畫面模糊，且像素佔比極低。

解析度提升： 將 imgsz 提升至 1280，增加模型對微小細節的感知。
影像拼貼 (Mosaic)： 設定 mosaic=0.8，增加單一畫面中的物件密度，緩解小樣本問題。
座標限制： 關閉垂直翻轉 (flipud=0.0)，因為場景中不會出現倒掛的球桌。

hyp_config = {
    "epochs": 500,
    "imgsz": 1280,      # 提升解析度捕捉細節
    "mosaic": 0.8,      # 拼貼影像，增強小物件訓練
    "mixup": 0.1,       # 影像融合
    "flipud": 0.0       # 關閉垂直翻轉以符合現實場景
}

實作成果

效能分析 (Performance)

混淆矩陣顯示模型對於大物件（球桌、裁判、球員）的準確率極高。然而，受限於樣本數與影像模糊程度，小物件（球拍、球）仍有進步空間。

Training Loss & Inference

模型在 500 個 Epoch 內穩定收斂，Loss 曲線顯示並無過擬合現象。

最終偵測結果

模型成功辨識出複雜背景下的球桌、球員與裁判位置。