︿
Top

SEMI:AI人工智慧和未來新興運算架構

瀏覽次數:2415| 歡迎推文: facebook twitter wechat twitter twitter

科技產業資訊室 - May 發表於 2019年7月8日

圖、SEMI:AI人工智慧和未來新興運算架構

隨著深度學習的數據運算需求,AI人工智慧晶片呈現倍數成長,然而「效能」與「能耗」卻成為晶片工藝亟需解決的兩項問題。為此,全球 IC 設計企業轉向系統級層面的解決方案,衍生出 GPU、FPGA及ASIC等異質運算架構。
 
人工智慧架構從建構到應用可以分為兩層,分別是後端的「訓練(Training)」與前端的「推導(Inference)」。訓練是指將複雜的圖形、影像或是語音數據輸入到深度學習模型,重複運算與修正以提高演算法準確度,最後產出可用的類神經網路軟體;後者是將已經訓練好的類神經網路軟體放入終端裝置,用以推導新的數據,實現生活中的人工智慧應用,例如自動駕駛、語音識別、圖像辨識及影像處理等等功能。
 
為了洞察未來 AI 晶片的產業趨勢, SEMI國際半導體產業協會日前所舉辦的「智慧數據產業論壇」邀請到來自聯發科(MediaTek)、英特爾(Intel)、輝達(NVIDIA)、新思科技(Synopsys)的技術專家出席進行專題分享,從業界的角度探討 AI 晶片產業的發展現況。以下,精彩內容:
 
<<邊緣運算(Edge Computing)是智慧應用的發展關鍵>>
 
倘若,執行 AI 運算的設備並不在雲端伺服器,而是在效能有限的終端裝置,使得「邊緣運算」成為企業在發展人工智慧應用中必須解決的難題。
 
聯發科(MediaTek)的吳驊處長
認為邊緣運算對於人工智慧產業越來越重要,例如手機上的系統晶片、具備人臉辨識功能的攝影機等等,AI 應用都仰賴終端設備的晶片進行運算。但邊緣運算的硬體卻有體積與耗能上的嚴格限制,面對額外的計算需求,聯發科選擇在新一代的 Helio P90 晶片整合獨立的 APU (AI Processing Unit),專門處理 AI 演算法的運算需求,以異質整合的方式提升晶片效能並降低耗電量。
 
長遠來看,他認為更多的 AI 應用都會在終端裝置上完成「推導」,隨著運算越趨複雜,邊緣計算晶片將面臨散熱與面積的挑戰,由於 AI 專用晶片運算效率遠高於通用晶片,使得發展專用晶片架構成為業界的普遍共識。
 
<< FPGA 彈性架構適合開發 AI 推論晶片>>
FPGA (可程式化邏輯閘陣列) 是目前最受歡迎的AI 晶片設計架構之一。
 
英特爾(Intel)的周凱楓工程師
Intel 看好 FPGA 在 AI 應用晶片的潛力,因為FPGA架構除了有低功耗、高度設計彈性以及低成本等優勢,它的開發時程也相對短,有助於企業滿足變化萬千的利基市場。Intel 所開發的 OpenVINO 工具包或是eASIC 解決方案都進一步將FPGA架構的優勢最大化,加速AI晶片的開發展。
 
<<多GPU架構能提供強大的平行運算能力>>
相較於前端的「推論」,後端的AI 演算法「訓練」需要龐大的平行運算能力,單個 GPU 已經無法滿足日漸複雜的深度學習模型。
 
輝達(NVIDIA)的康勝閔經理
從架構層面出發,比較新一代 NVSwitch 架構藉由改善多顆 GPU 之間的溝通效率,將深度學習模型的訓練時間從 15 天縮短到 1.5 天。他認為改善 AI 的運算效率不只是追求更強的晶片效能,對演算法的了解與軟體的堆疊也非常重要,例如針對不同的演算法開發對應的加速函式庫(cuDNN),透過軟硬整合才能達到更高的運算效率。
 
<<人工智慧晶片設計的未來發展:異質整合>>
 
新思科技(Synopsys)的魏志中策略總監
隨著運算的需求種類增加,如果要兼顧耗能及成本,單一晶圓(Die)的晶片已經無法滿足。他強調「異質整合」Heterogeneous Integration的概念,透過在系統級封裝(System in Package, SiP)中整合多項異質運算晶片,試圖解決效能、功耗以及設計彈性上的問題。
 
好比聯發科在原本的 SoC 整合一個獨立的 AI 加速器,另外 Intel 所提出的 eASIC,原理也是把ASIC 透過 FPGA 的方式埋進晶片以提高設計架構上的彈性。
 
結語
AI 晶片的應用很廣,單一架構無法滿足所有的運算需求,使得「異質整合」晶片的需求應運而生。然而,不只是單純晶片效能改進,企業也必須進行全面思考,從上層的演算法、中層的編譯器以及底層的硬體進行全面最佳化,才是未來 AI 晶片的整合趨勢。(1200字;圖1)
 
 
參考資料:
AI世代異質運算架構首重效能與能耗。SEMI Taiwan,2019/7/1。


本站相關資料:
1. Xilinx推出ACAP自行調適運算及Everest採用台積電7奈米製程
2. Gartner:物聯網10大趨勢、資訊長必讀
3. 英特爾開發出全新3D堆疊封裝技術Foveros
4. 阿里巴巴研發自主AI晶片Ali-NPU
5. AI推動全球機器學習晶片市場2025年達378億美元

 
歡迎來粉絲團按讚!
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1. 科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2. 著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。