Window10的Pytorch+Yolov5的安裝與使用

筆者使用Window10,Nvidia GTX 1660Ti顯卡。

Step1)安裝YOLOV5(https://github.com/ultralytics/yolov5)

#cd c:\

#git clone https://github.com/ultralytics/yolov5

Step2)安裝Python虛擬環境

#conda create -n yolov5 python=3.8

#conda activate yolov5

Step3)安裝cuda10.2與cudnn8.4.1。

請參考Windows10上安裝TensorFlow GPU套件

筆者使用GTX 1660Ti,安裝cuda11.4會造成訓練時所有box與obj都是nan,使用cuda10.2就恢復正常。將cuda從新安裝10.2版本,系統path新增「C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin」與「C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\libnvpp」,系統CUDA_PATH修改為「C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2」,如下圖。

此時執行nvcc -V會顯示10.2,如下圖,表示cuda為10.2版本。

執行nvidia-smi會顯示驅動程式版本為11.4,驅動程式版本下向相容於10.2,目前cuda使用10.2。

Step4)安裝pytorch(https://pytorch.org/get-started/locally/),雖然pytorch網站已經說不支援cuda10.2,但是透過以下指令安裝還是可行。

#conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch

Step5)安裝yolov5所需套件

#cd c:\yolov5

#pip install -r requirement.txt

Step6)開啟攝影鏡頭進行辨識,左邊為攝影機的輸出結果,右邊為即時的辨識結果

#python detect.py --source 0

Step7)輸入圖片進行辨識,在C:\yolov5\images\放入一張圖片,例如:1.jpg,結果顯示有12個人...。

#python detect.py --source images/1.jpg

Step8)使用Youtube影片進行辨識,會自動安裝pafy與youtube_dl

#python detect.py --source https://www.youtube.com/watch?v=xxxxxxxxx