AI加速器設計與系統整合

近年來,由於水下養殖蓬勃發展,在陸地生活的我們無法透過肉眼去窺探水中養殖生物的世界的全貌,因此我們利用架設水下攝影機去監測養殖生物,並且利用攝影機透過網路串流的方式,將觀測到的水下影像傳輸到後台伺服器,接著我們利用深度學習的技術,使機器有能力自動去判別水下生物的一舉一動,舉凡進食狀態、活動力、生長狀態以及飼料餵食狀況等等,但是在網路串流環境下,傳輸延遲、功耗過高以及硬體使用率效果不彰,針對以上這些問題,我們提出基於深度神經網路的系統優化的整合方案,開發一款提高硬體使用率、降低傳輸延遲及功耗的硬體設計電路,以及針對所開發硬體建置系統整合的全新優化方案。

圖()提出系統運作概念圖

圖()傳輸影片經由FPGA運算輸出影像

開發硬體加速器特色

•1.整合系統中使用AXI4傳輸協定並採用Outstanding模式減少傳輸延遲。

•2.高效率支援1x1、3x3 捲積運算,彈性支援大型核心大小捲積、全連接層、反捲積神經網路。

•3.重構式架構支援Depthwise Convolution以及Pointwise Convolution合併神經層運算,提升硬體使用率以及減少傳輸功耗。

•4.針對神經層架構使用資料合併技術減少近50%的DRAM 存取次數。


圖()系統問題示意圖

圖()設計硬體架構圖

成果影片介紹