AI加速器設計與系統整合
近年來,由於水下養殖蓬勃發展,在陸地生活的我們無法透過肉眼去窺探水中養殖生物的世界的全貌,因此我們利用架設水下攝影機去監測養殖生物,並且利用攝影機透過網路串流的方式,將觀測到的水下影像傳輸到後台伺服器,接著我們利用深度學習的技術,使機器有能力自動去判別水下生物的一舉一動,舉凡進食狀態、活動力、生長狀態以及飼料餵食狀況等等,但是在網路串流環境下,傳輸延遲、功耗過高以及硬體使用率效果不彰,針對以上這些問題,我們提出基於深度神經網路的系統優化的整合方案,開發一款提高硬體使用率、降低傳輸延遲及功耗的硬體設計電路,以及針對所開發硬體建置系統整合的全新優化方案。
近年來,由於水下養殖蓬勃發展,在陸地生活的我們無法透過肉眼去窺探水中養殖生物的世界的全貌,因此我們利用架設水下攝影機去監測養殖生物,並且利用攝影機透過網路串流的方式,將觀測到的水下影像傳輸到後台伺服器,接著我們利用深度學習的技術,使機器有能力自動去判別水下生物的一舉一動,舉凡進食狀態、活動力、生長狀態以及飼料餵食狀況等等,但是在網路串流環境下,傳輸延遲、功耗過高以及硬體使用率效果不彰,針對以上這些問題,我們提出基於深度神經網路的系統優化的整合方案,開發一款提高硬體使用率、降低傳輸延遲及功耗的硬體設計電路,以及針對所開發硬體建置系統整合的全新優化方案。
圖(一)提出系統運作概念圖
圖(一)提出系統運作概念圖
圖(二)傳輸影片經由FPGA運算輸出影像
圖(二)傳輸影片經由FPGA運算輸出影像
開發硬體加速器特色
開發硬體加速器特色
•1.整合系統中使用AXI4傳輸協定並採用Outstanding模式減少傳輸延遲。
•1.整合系統中使用AXI4傳輸協定並採用Outstanding模式減少傳輸延遲。
•2.高效率支援1x1、3x3 捲積運算,彈性支援大型核心大小捲積、全連接層、反捲積神經網路。
•2.高效率支援1x1、3x3 捲積運算,彈性支援大型核心大小捲積、全連接層、反捲積神經網路。
•3.重構式架構支援Depthwise Convolution以及Pointwise Convolution合併神經層運算,提升硬體使用率以及減少傳輸功耗。
•3.重構式架構支援Depthwise Convolution以及Pointwise Convolution合併神經層運算,提升硬體使用率以及減少傳輸功耗。
•4.針對神經層架構使用資料合併技術減少近50%的DRAM 存取次數。
•4.針對神經層架構使用資料合併技術減少近50%的DRAM 存取次數。
圖(三)系統問題示意圖
圖(三)系統問題示意圖
圖(四)設計硬體架構圖
圖(四)設計硬體架構圖
成果影片介紹
成果影片介紹