PyTorch深度學習物件偵測模型實作.
本課程的主要內容在於以上所有YOLO模型的理論介紹與實作,實作內容包括了如...
PyTorch深度學習物件偵測模型實作(從YOLOv1-v8)
課程型態/ 混成(實體+線上同步)
上課地址/ 實體:工研院產業學院 產業人才訓練一部(台北) (實際地點以上課通知為主!) 線上:線上直播會議室(使用Cisco Webex Meeting)
時數/ 12小時
起迄日期/ 2024/01/18~2024/01/25
聯絡資訊/ 陳品諠 (02)2370-1111 #303
報名截止日/ 2024/01/11
------------------------------------
課程介紹
近年來深度學習技術在各種機器學習任務上達到前所未有的精度,這樣的突破使得自駕車或是機器人甚至是AIOT中的感知系統在可靠度上有了極大的提升。
在各種深度學習模型中,應用最廣泛的就是所謂的物件偵測模型,而物件偵測模型最受歡迎的就是YOLO的各種衍生版本,從2015年YOLOv1橫空出世以來,大部份即時物件偵測系統都是應用YOLO,其原因在於 YOLO一直在辨識率以及速度上得到了很好的平衡,之後的YOLOv2-v5,甚至是2021年的YOLOX,2022年的YOLOv7以及2023年的YOLOv8都持續的在這兩個最重要的指標上突破。
然而,這些各代YOLO除了速度與辨識率的差異外,還有什麼呢?你知道YOLOv1無法偵測重心在同一個grid cell的不同類物體,但YOLOv2可以嗎?你知道YOLOv3可以實現單一物體多類別的偵測與辨識嗎?你知道YOLOv4使用了那些trick使得mAP提升了那麼多嗎?你知道YOLOX的decoupled head對辨識率的影響有多大嗎?你知道在MSCOCO這個資料集,如果將輸入影像的解析度限制在640x640,其實YOLOv4的辨識率比YOLOv5與YOLOX高嗎?那YOLOv5與YOLOX的優勢在什麼地方?你知道YOLOv7就辨識率來說並沒有達到史上最高,但卻達到辨識率與及速度的最佳平衡,你知道YOLOv8基於YOLOv5並借鑑YOLOv7中的哪些設計思維因而能再一次的提升辨識率嗎?
本課程的主要內容在於以上所有YOLO模型的理論介紹與實作,實作內容包括了如何修改這些模型使其能在客制化的資料集上完成訓練。此外,本課程內容還包括運用Optuna這樣的超參數調整函式庫,在物件偵測模型訓練的效能不如預期,但手動調整超參數,效能提升也有限的情形下,自動化的調整超參數,以顯著提升辨識率。若你手邊有足夠的GPU訓練資源,我們可以使用更為進階的RayTune平行化超參數搜尋,以進一步的提升搜尋效率。
經過本次課程的洗禮,您將學會(1) 以上八個YOLO模型各有什麼優缺點,以及如何針對自己的應用選擇一個最佳的模型,例如自駕車或是室內監控系統,(2) 如何運用一個物件偵測模型解決特定問題,例如從頭訓練一個模型以偵測紅血球與白血球,(3) 在訓練效果不佳時,如何有系統的調整超參數以提升辨識率。
本課程所有的程式都使用PyTorch在Colab此雲端平台上開發,實作範例包含資料集以及程式碼都會提供,本次課程的內容包括了:
- 深度學習各種資料集簡介,辨識率定義以及辨識率計算實作
- 辨識率(Average Precision)以及Non-Maximal Suppression實作
- YOLOv1原理以及實作(使用Pascal VOC dataset實作與口罩資料集)
- YOLOv2原理以及實作(使用Pascal VOC dataset實作)
- YOLOv3原理以及實作(使用Carsim dataset)
- YOLOv4原理以及實作(使用BCCD dataset)
- YOLOv4超參數最佳化(使用Optuna最佳化在 BCCD dataset上的辨識率)
- YOLOv5原理以及實作(使用 COCO128 dataset)
- YOLOX原理以及實作(使用 COCO128 dataset與口罩資料集)
- YOLOv7原理以及實作(使用口罩資料集與VisDrone資料集)
- YOLOv8原理以及實作(使用口罩資料集與VisDrone資料集)
- YOLOv8原理以及實作(使用RayTune最佳化在VisDrone資料集上的辨識率)
課程目標
- 熟悉Python此程式語言
- 學會運用PyTorch 開發深度學習模型
- 協助具影像處理/電腦視覺專長之學員切入電腦視覺、深度學習領域
- 未來應用這樣的深度學習模型至駕駛輔助系統、自駕車甚至是機器人中的視覺感知次系統
課程對象
1. 深度學習各種資料集簡介,辨識率定義以及辨識率計算實作 2. 辨識率(Average Precision)以及Non-Maximal Suppression實作 3. YOLOv1原理以及實作(使用Pascal VOC dataset實作與口罩資料集) 4. YOLOv2原理以及實作(使用Pascal VOC dataset實作) 5. YOLOv3原理以及實作(使用Carsim dataset) 6. YOLOv4原理以及實作(使用BCCD dataset) 7. YOLOv4超參數最佳化(使用Optuna最佳化在 BCCD dataset上的辨識率) 8. YOLOv5原理以及實作(使用 COCO128 dataset) 9. YOLOX原理以及實作(使用 COCO128 dataset與口罩資料集) 10. YOLOv7原理以及實作(使用口罩資料集與VisDrone資料集) 11. YOLOv8原理以及實作(使用口罩資料集與VisDrone資料集)
12. YOLOv8原理以及實作(使用RayTune最佳化在VisDrone資料集上的辨識率)
|
講師簡介
林哲聰 老師
- 學歷:台灣大學應用力學研究所碩士/清華大學資訊工程研究所博士
- 現職:Chalmers University of Technology 博士後研究員
- 經歷:馬來西亞偉特科技公司(ViTrox)研發顧問
工研院機械所副研究員/研究員/資深研究員
加州大學聖塔芭芭拉分校資工系訪問研究員
上奇資訊-計算機概論 共同譯者
2010 伽利略創新大賽 台灣區季軍
2011 伽利略創新大賽 特別獎(GNSS Living Lab)得主
2013 伽利略創新大賽 瑞士區冠軍
2016 日本立命館大學英文演講比賽 清華大學代表
2017 CVGIP 行人偵測競賽 亞軍
2017 MOST 生成式對抗網路競賽 佳作
2018第八屆兩岸清華研究生學術論壇 清華大學代表
2019 IEEE ICIP Three Minute Thesis Competition (3MT®): Finalist
2020 AI智慧應用新世代人才培育計畫-人才解題實證(倒車攝影機影像識別-障礙物與逼近偵測): 佳作
2020 中華民國影像處理與圖形識別學會第十三屆博碩士論文獎博士論文佳作
2020 中華民國資訊學會碩博士最佳論文獎-博士論文佳作 - 專長:Computer Vision, Image Processing, Pattern Recognition, Machine Learning, Deep Learning, Python/C/C++ Programming
已於電腦視覺/深度學習/駕駛輔助/自駕車領域中發表過三十七篇國際論文,十五篇國內論文,以及十三篇專利。
開課資訊
- 主辦單位:工研院產業學院 台北學習中心
- 舉辦地點:
實體:工研院產業學院 產業人才訓練一部(台北) (實際地點以上課通知為主!)
線上:線上直播會議室(使用Cisco Webex Meeting)
- 舉辦日期:113/01/18、25 (隔週四) ,09:30~16:30(12小時)
- 訓練對象:
- 具備程式設計能力,未來想投入機器學習、電腦視覺或資料科學領域的工程師
- 想應用電腦視覺、機器學習相關技術至物聯網、駕駛輔助/自駕車系統之程式設計師
- 報名方式:請以正楷填妥報名表傳真至02-23811000 或 email至 itri535842@itri.org.tw
- 課程洽詢:02-2370-1111 *303陳小姐 *315 陳先生
課程費用
報名方案 |
費用 |
課程原價 |
每人10,800元 |
早鳥價 (開課前3週) |
每人9,800元 |
團報價 (三人以上) |
每人9,200元 |
注意事項
- 為確保您的上課權益,報名後若未收到任何回覆,敬請來電洽詢方完成報名。
- 因課前教材、講義及餐點之準備及需為您進行退款相關事宜,若您不克前來,請於開課三個工作日前告知,以利行政作業進行並共同愛護資源。
- 若原報名者因故不克參加,但欲更換他人參加,敬請於開課前二個工作日通知。