︿
Top

輝達不滿足在GenAI領導的現狀,推出新架構和軟體服務,往全方位AI公司前進

瀏覽次數:8679| 歡迎推文: facebook twitter wechat Linked

科技產業資訊室 - 茋郁 發表於 2024年3月20日
facebook twitter wechat twitter

圖、輝達不滿足在GenAI領導的現狀,推出新架構和軟體服務,往全方位AI公司前進

輝達在2024年GTC會議上,提出了其未來營運的兩大重點。第一:重塑下一的底層架構,使其GPU晶片成為GenAI革命中極其重要的一部分。其次,它宣布了一系列廣泛的工具和合作夥伴關係,使各種類型的企業將GenAI應用程式投入生產的過程變得更加容易。

在此過程中,輝達也強調了其成為軟體和服務公司的雄心壯志,發布了AI Enterprise 5.0和新NIM(Nvidia Inference Microservices)。 該公司還成功擴大了應用範圍以及致力於提供關鍵GenAI運算解決方案的產業,包括:醫療保健、重工業、汽車、機器人、製造、電信(6G)、天氣預報等。

在晶片方面,自兩年前推出Hopper架構以來,新一代Blackwell GPU架構誕生。輝達表示,Blackwell提供的20 PetaFLOPS人工智慧效能在AI訓練工作負載上快了4倍,在AI推理工作負載上快了30倍,最值得注意的是,其能源效率比Hopper提高了25倍。

儘管單一Blackwell GPU的功能已經很強大,但在MoE(Mixture of Experts ) AI「超級模型」的新時代,迫切需要將大量的GPU連接在一起。因此,新的NVLink 5.0技術就變得很重要,因為它允許最多576顆GPU以高達1.8 TB/Sec的速度連接在一起。

與上一代產品一樣,輝達還整合了一款“超級晶片”,將其最新的GPU與基於Arm的CPU設計結合起來。最新的超級晶片版本稱為Grace Blackwell 200(或簡稱 GB200),它包括兩個Blackwell GPU和一個Grace CPU。

該公司還推出了一系列新的交換機,包括基於InfiniBand的Quantum-X800交換器和基於乙太網路的Spectrum-X800。兩者都利用該公司的BlueField技術來加快將資料透過數據中心輸入GPU進行處理的過程。

即使主要的雲端供應商都正在研發自己的解決方案,但其和伺服器製造商仍都宣布很快就會推出基於Blackwell設計的服務或系統。此外,還有一些軟體供應商也宣布他們將在其應用程式的下一代版本中支援Blackwell和這些最新設計。

至於軟體,輝達的重大軟體是引入了NIM的微服務,它是AI Enterprise 5.0版本的一部分。這些微服務是在CUDA軟體平台之上運行的Web原生容器,專門設計用於簡化創建和開發可利用CUDA和輝達硬體的GenAI應用程式的過程。

未來這些新的微服務可以為輝達創建全新的營收來源和業務策略,因為它們可以按每個GPU/hr(以及其他變體)進行授權。這是輝達新營收的嘗試,值得關注。

總之,輝達不僅在硬體上,期望拉大與競爭者差距,也想利用新的軟體應用程式和微服務希望將公司定位為更廣泛、更重要的GenAI產業長期推動者。顯然,輝達不滿足於現今的領先地位,而想要拉長領先產業的時間,成為真正AI的王者呢!(1186字
;圖1


參考資料:

 
歡迎來粉絲團按讚!
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1.科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2.著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。