Yolo 的系列在 2024年 發布了 Yolo V9,由於 Ultralytic 公司 將先前的 Yolo v5 改成了 AGPLv3,導致了 Yolov9 雖然是台灣工研院團隊在開發,但由於使用了一部分Ultralytic 的 code,最後另外發佈另一個 MIT Yolo 的版本。不否認 Ultralytic 的版本很好用,實測過 yolo12 的確是很好上手,畢竟是商業化的公司,真的部屬很快,速度也很不錯,但這商業化的方法不是很認同,剛好又看到 中研院發佈的 MIT YoloV9的版本,目前測試 訓練、推理、轉成 onnx 檔案、使用 onnx檔案推理 也都能順利做到,在此預計做個系列分享。一方面感謝中研院的團隊,另一方幫忙補上一些目前官方網站缺少的資訊
Yolo v9 目前有哪些優點?
Yolo 基本上可以說是分兩大分支在開發
(1)首先分支就是中研院這分支,最初Yolo 的原創者 Joseph Redmon 發布到v3後由 Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao 發布 yolov4
| Alexey Bochkovskiy | YOLOv4 實作主導人,俄羅斯開發者 |
| Chien-Yao Wang 王建堯 | 中央研究院資訊所(台灣) |
| Hong-Yuan Mark Liao 廖弘源 | 中央研究院資訊所(台灣) |
Yolo 後續的很多開發架構與影像強化的方案是由 v4 發展出來,v4可以說是把過去很多很好的論文,大量套用到yolo 的架構內,算是奠基了yolo強大的基礎
一開始 yolo v9 也套用了 Ultralytic 的架構,但或許是Ultralytic 改了授權規定,導致有了目前這MIT Yolo v7 v9 rd 的這個版本。
目前測試下來,性能夠用,目前使用 RTX-4060 8G(75W) 執行(v9-t) 500萬像素影像推論,每秒可達 910張
但缺點就是不夠友善,需要自己再做修改,但中研院已經給了一個很完善的架構
程式動手能力稍微不錯的人可以考慮做些修改。做一個自己公司的版本
(2)另外是Ultralytic 的這一分支,這分支已經商業化,使用上比較方便,支援度高,但這開發費,有興趣的人可以問問,目前側面了解,會跟公司規模有關,每年授權,另外現場佈署不知還要收多少費用
Ultralytic 這體系也是幫助良多,首先將整體架構移植到PyTorch下,讓Yolo變為更好維護,也吸引更多的使用者,商業化的模式只能說看大家的觀感
1、安裝測試環境
測試環境就不多說,只要電腦還可以,當然建議在自己的電腦跑
目前的電腦配置是
RAM:32G
CPU:i5-13500H
GPU:RTX-4060 8G
作業系統:Windows 11 (24H2)
編譯器:VS Code
測試環境建議安裝 Miniocda ( Anaconda 安裝太多不需要的套件,如要有多UI的使用倒是可以)
https://www.anaconda.com/download/success
Anaconda 就不再此多做介紹,相信很多使用 python的朋友都已經很了解
安裝的時候如果 C: 剩餘空間不多,建議安裝到 D:或其他槽,安裝後可以看到會新增此 ICON


首先 開啟後 準備建立一個環境
conda create --name yolord-main python=3.11
yolord-main 是我設定的環境名稱,大家可以自訂義 比如 yolov9
python 是預設此環境python的版本,這邊不建議安裝最新的版本
在這時最新的版本是3.13,很多時候最新的版本很多時候相容性會差一些
開始安裝前會顯示 提問是否確認安裝 搭配此環境的 基本需求套件

此時當然選 Y
後續就會開始下載安裝 最後顯示 安裝完成的畫面與後續 切換到此環境的 指令

再來切換到 我們的新環境
conda activate yolord-main

看到前綴由 (base) => (yolord-main) 就已是切換成功
再來是下載 yolo v9 rd 的檔案。個人比較推薦 由 github 下載另外解壓縮存放
https://github.com/MultimediaTechLab/YOLO
官方在git 是
pip install git+https://github.com/WongKinYiu/YOLO.git
git clone git@github.com:WongKinYiu/YOLO.git
但此方法如果只是稍微測試或只是拿來玩玩,到是不錯,如果後續是要做後續開發 建議是下載後另外解壓縮
首先切換到 解壓縮後存放的資料夾

安裝 所需要的配套
pip install -r requirements-dev.txt

接下來會開始下載 與 安裝套件
安裝好後再下達 pip install -e . 將此環境的工作目錄指定到目前所在資料夾下
pip install -e .

如此 基本的環境就設定好了大半
再來,需要安裝 PyTorch,由於 PyTorch 會與每個人的環境不同會有不同版本的下載安裝
如果只有CPU 當然也可以,但我想應該有GPU的人不會想用CPU來訓練,至於為何 有興趣的人可以玩玩.......一種讓電腦原地飛升感覺會讓你很有所感
首先使用指令查詢一下 目前CUDA的版本
nvcc -V (注意 V 大寫)

查詢到的CUDA 是 12.2的版本,再來準備下載
建議可選 先前最大版本的最後版本,另外可安裝 小於 12.2的 11.8 的版本
pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu118
再來就會需要一段時間 下載與安裝

最後檢查 安裝的狀況
pip show torch

如此 基本的環境 已設置完成
