AI加速器設計與系統整合

近年來，由於水下養殖蓬勃發展，在陸地生活的我們無法透過肉眼去窺探水中養殖生物的世界的全貌，因此我們利用架設水下攝影機去監測養殖生物，並且利用攝影機透過網路串流的方式，將觀測到的水下影像傳輸到後台伺服器，接著我們利用深度學習的技術，使機器有能力自動去判別水下生物的一舉一動，舉凡進食狀態、活動力、生長狀態以及飼料餵食狀況等等，但是在網路串流環境下，傳輸延遲、功耗過高以及硬體使用率效果不彰，針對以上這些問題，我們提出基於深度神經網路的系統優化的整合方案，開發一款提高硬體使用率、降低傳輸延遲及功耗的硬體設計電路，以及針對所開發硬體建置系統整合的全新優化方案。

圖(一)提出系統運作概念圖

圖(二)傳輸影片經由FPGA運算輸出影像

開發硬體加速器特色

•1.整合系統中使用AXI4傳輸協定並採用Outstanding模式減少傳輸延遲。

•2.高效率支援1x1、3x3 捲積運算，彈性支援大型核心大小捲積、全連接層、反捲積神經網路。

•3.重構式架構支援Depthwise Convolution以及Pointwise Convolution合併神經層運算，提升硬體使用率以及減少傳輸功耗。

•4.針對神經層架構使用資料合併技術減少近50%的DRAM 存取次數。

圖(三)系統問題示意圖

圖(四)設計硬體架構圖

成果影片介紹

Page updated

Google Sites

Report abuse