AI晶片設計


CASLab GPU: An Edge AI GPU Processor Supporting OpenCL and TensorFlow CNN

近年來人工智慧、機器學習領域快速發展,資料處理量大幅提升,通用型繪圖處理器(GPGPU)開始被廣泛運用於需要計算大量資料且可高度平行化處理的應用上。談到GPU 大家總會想到 NVIDIA、AMD、ARM 等大型國外公司,鮮少聽到有國內廠商自行開發的 GPU , 而 CASLab GPU 則是由國立成功大學電機工程系 Computer Architecture and System Laboratory 的師生自 2013 年起規畫研製,從軟體端到硬體端完整的系統開發,目標在打造出國內自己的第一顆 SIMT 運算型 GPU。本文介紹CASLab GPU 軟硬體設計的相關議題。

CASLab GPU 是以 Edge Computing 為目標,並符合 OpenCL/TensorFlow API規範,建構包含軟體及硬體的整體系統。這包括根據 OpenCL 規範設計 CASLab GPU的 Runtime,更自行開發了 CASLab GPU 的 OpenCL LLVM Compiler。透過優化的編譯流程,使軟體堆疊更能配合硬體的運作,獲得大幅整體效能之提升,提供開發人員便利的開源執行環境。軟體層無論是 OpenCL Runtime、Compiler 都是由C程式開發,CASLab GPU 無論是搭配 ARM、RISC-V CPU 都能夠在其上運作與進行開 發。

CASLab GPU 透過電子系統層級 (Electronic System-Level, ESL)的 Full System 設計方案,軟體與硬體開發能在早期開發即進行系統驗證。利用 C 與 C++所實作的指令級模擬器(Instruction Set Simulator, ISS)可驗證指令集的功能正確性並提供時間模型(Timing Model)來做效能上的初步評估。而 SystemC 等高階硬體描述語言則提供彈性的硬體設計方法,因為是 Cycle-Accurate 行為,開發者在早期階段就能夠更準確的達到效能分析,也能作為後續如 Verilog 等暫存器傳遞語言(Register-transfer Language)的實作範本。目前 CASLab GPU 已在 FPGA 層級完成功能性的驗證,接下來會繼續優化與考慮實際硬體的成本,讓 CASLab GPU 能夠成為一顆高效能的 Edge Computing IP。