中原大學 NVIDIA 高效能運算(HPC)資源叢集,於2020年5月由時任張靜愚紀念圖書館系統資訊組組長賴裕昆率領電機工程學系研究生團隊規劃建制,並設置於圖書館系統資訊組機房。該叢集透過 Gemini AI Console 管理系統進行整體資源管理與調度,整合多元 GPU 運算設備,提供校內人工智慧與高效能運算所需的關鍵基礎設施。
目前系統架構包含一部 SuperMicro SuperServer 4029GP-TRT2 伺服器,內建七張 NVIDIA A100 GPU 加速卡;一部 NVIDIA DGX 工作站(搭載 4 張 Tesla V100 GPU);以及四部 HPE ProLiant L380 Gen10 工作站(搭載 Tesla P40 GPU)。其中,NVIDIA DGX 工作站配置 20 核心 Intel Xeon 處理器、256GB DDR4 主記憶體,並搭載四張 NVIDIA Tesla V100 GPU(總顯示記憶體達 128GB)。每部 HPE ProLiant L380 工作站則配備兩顆 20 核心 Intel Xeon Gold 6148 處理器、256GB DDR4 主記憶體,以及兩張 NVIDIA Tesla P40 GPU。所有運算節點透過 10Gbps 高速乙太網路連接,並以 **網路檔案系統(NFS)**共享 64TB 集中式資料儲存空間,有效支援大量資料存取與運算需求。
該高效能運算叢集以 Kubernetes 平台即服務(Platform as a Service, PaaS為核心,提供容器化管理與智慧化調度機制,使使用者能快速取得並彈性運用運算資源。使用者透過校園網路完成 LDAP 帳號認證後,即可取得 100GB 個人網路硬碟空間,並透過瀏覽器啟用容器化 IDE 介面,使用 PyTorch、Jupyter Notebook、RStudio 等開發工具,進行互動式程式設計、基礎課程教學與實作學習;同時亦可透過任務排程機制執行模型訓練,提升大規模資料分析與深度學習運算的整體效率。
在應用層面,該叢集提供多元化的應用環境與彈性資源配置方案(Solution/Flavor)。目前已建置 多種不同的容器應用環境組合(Container Image Solutions),涵蓋多項應用程式(如 Matlab、Xilinx FPGA、OpenCV,並持續擴充中)、開發環境(PyCharm、Jupyter Notebook、Visual Studio Code),以及不同版本的機器學習程式庫(如 TensorFlow)與相關驅動軟體,滿足跨領域研究與教學需求。
使用者可透過 Gemini AI Console 管理平台,依實際研究或教學需求,自行選擇不同規模的 CPU 與 GPU 資源配置,進行模型訓練與資料分析,提升運算資源使用彈性與整體效能。
目前該系統已開放全校師生申請使用,使用族群橫跨設計學院、電資學院、理學院、工學院及商學院等多個學院,涵蓋化工、物理、機械、電子、資訊、資訊管理、財經、建築、土木、應用數學及醫學工程等系所,累計已有 超過 150 位教師與學生投入使用,成為中原大學推動人工智慧研究與跨域教學的重要運算平台。