本系統旨在提供一套高效的影像標註工具,專門用於針對物件進行邊界框(bounding box)的標註作業,以利日後應用於機器學習與電腦視覺領域的任務中,如物件偵測。系統設計上支援多種標註格式,包括 Pascal VOC 與 YOLO,並提供直覺式的圖形使用者介面(GUI),方便使用者快速上手操作。為了提升彈性與通用性,系統亦允許自訂標籤內容,並可與主流的深度學習框架(如 TensorFlow 與 YOLO)結合使用,作為訓練資料前處理的重要工具。
標註流程首先從匯入影像開始。使用者可將預處理後的 BMP 格式圖片載入 LabelImg 工具中,進行後續的花草標註作業。如下圖3-1在標註階段,使用者需以滑鼠手動框選出影像中每一株花草所對應的區域,並為每個框選物件輸入其對應的花草學名,藉此建立具有標籤與座標資訊的訓練資料(.txt)。
透過這樣的操作方式,系統可以協助使用者快速地產出高品質的資料集,同時確保每一筆資料都經過人工確認與校正,增加日後模型學習的準確性與可靠性。
使用介面介紹:
點選左上角:
Open Dir:選擇你要標註的圖片資料夾。
圖片會依序載入,你可以透過 Next Image / Prev Image 切換圖片。
點選左側工具列的 Create RectBox。
在圖片上拖曳滑鼠,畫出你想標註的物件(如花朵)。
標註後,會跳出一個視窗讓你輸入 Label(這裡輸入的是 Ixora coccinea)。
點選左側的 Save 或使用快捷鍵 Ctrl + S。
LabelImg 預設會儲存成 .xml(Pascal VOC)格式。
如果要輸出 YOLO 格式(.txt),你需要點左側的 YOLO,然後再儲存。
點選左側 Next Image 或快捷鍵 D(前一張是 A)來標註下一張圖片。
(參照圖3-1)
圖3-1
完成物件標註後,系統會自動產生對應的 TXT 檔案作為標註文件如圖(二)。這些文字檔案中詳列了每張圖片中所有被標註物件的類別編號與相對座標資訊(包含物件中心點位置與寬高比例等),這些資料可直接餵入 YOLO 等模型進行訓練使用。
為了更方便資料的管理與整理,系統亦提供排序功能,使用者可透過 Python 腳本將標註資料依照指定順序排序與命名。此功能能有效對應到訓練模型所需的輸入格式,並使得整體流程更加自動化與一致。
圖3-2中由左到右分別是<類別編號> <x_center> <y_center> <width> <height>
類別編號:表示這個物件是哪一類(例如 0 或 43,依據你自己定義的 label list)
x_center:框的中心點 X 座標(相對於圖片寬度,0~1 的小數)
y_center:框的中心點 Y 座標(相對於圖片高度)
width:框的寬度(相對於圖片寬度)
height:框的高度(相對於圖片高度)
🧠 範例解析
意思是圖(二)這張圖有兩個物件:
都是類別43
第一個物件在圖片中間偏左上,大小約佔 28% x 19%
第二個物件在中間偏下,大小約佔 30% x 21%
(參照圖3-2)
圖3-2
在完成標註並儲存為 YOLO 格式的 .txt 檔案後,這些檔案便成為後續分析與視覺化的基礎資料來源。每一筆資料都代表一個物件的定位與分類資訊,透過這些數據,我們能進一步統計各類別出現的頻率、分布狀況,甚至視覺化標註框在圖像中的位置。接下來,我們將這些 .txt 標註檔整理轉換為易於閱讀的圖表與圖像,協助更直觀地了解資料內容與標註品質。
1.各類植物標註樣本數統計圖 (參照圖3-3)
此圖3-3用以展示每個植物類別在訓練資料集中所對應的標註樣本數量。橫軸(X 軸)為分類類別(classes),縱軸(Y 軸)為每個類別的實際樣本數(instances)。透過不同顏色區分資料來源或子資料集,有助於分析資料分佈是否均衡,並作為資料擴充與採集策略之依據。
圖3-3
2. 標註框尺度分佈可視化圖 (參照圖3-4)
該圖3-4透過大量矩形框的重疊與漸層色彩,直觀呈現所有標註框的尺寸與數量分布情形。圖中每個矩形代表一筆標註,其面積與顏色對應標註框的大小與出現頻率,藉此了解常見物件尺寸範圍及標註集中位置。
圖3-4
3. 標註框中心點於影像空間之相對位置分布圖 (參照圖3-5)
此散點圖3-5展示所有標註框中心點於影像中之相對位置,橫軸與縱軸的數值範圍皆為 0.0 至 1.0,分別對應影像的水平與垂直位置。點的濃淡表示密度,深藍區域為標註密集區。此圖有助於分析資料是否集中於影像中心,並作為資料蒐集與模型訓練時參考的依據。
圖3-5
4.探討標註框尺寸比例的分佈特性 (參照圖3-6)
橫軸代表寬度(width)與影像寬度的比例,縱軸為高度(height)與影像高度的比例。藍色深淺反映數據點的密度,圖中多數標註集中於寬高皆低於 0.1 的區域,顯示多數植物物件較為細小。此分析有助於後續進行模型輸入尺寸設定與小物件偵測策略調整。
圖3-6