跳到主要內容

NVIDIA 發表 Blackwell 架構 GPU,為 AI 應用提供前所未有的性能


NVIDIA 最近宣布了一個新一代的 AI 加速器,稱為 Blackwell 架構。這個新系列包括 B100、B200 和 GB200 GPU,有希望為 AI 應用,特別是生成式 AI 領域,提供前所未有的性能。在這篇文章中,我們整理了一下這些新 GPU 的細節、規格、性能以及它們對 AI 產業的可能影響。


NVIDIA Blackwell 架構 

Blackwell 架構代表了 NVIDIA 在 GPU 技術上的最新進展,接替了 Hopper 架構。Blackwell 架構以著名數學家 David Harold Blackwell 的名字命名,引入了六項變革性技術,專門為了加速計算和生成式 AI。這些技術包括第二代 Transformer 引擎、第五代 NVLink、RAS 引擎、安全 AI 功能以及用於加速資料庫查詢的解壓縮引擎。


B100 和 B200 GPU

B100 和 B200 GPU 是基於 Hopper 的 H100 和 H200 的繼任者。預計 B200 將包含比 B100 更大的高頻寬記憶體容量。B200 是一個 1000W 的模組,高於 H100 的 700W,功率和性能有顯著提升。B200 被稱為世界上最強大的晶片,擁有 2080 億個電晶體,提供高達 20 petaflops 的 FP4 馬力。另一方面,B100 預計將是一個較低階的加速器,TDP 為 700W,使其可以直接與 H100 系統相容。




B100 和 B200 GPU 的整體外觀相比於 H100/H200 大,是因為 Nvidia 將兩組 Blackwell 架構的 Die,號稱是最大的兩顆 Die 直接連接在一起成為一個 Blackwell GPU。




GB200 超級晶片

GB200,也被稱為 Grace Blackwell 超級晶片,是兩個 B200 GPU 和一個 Grace CPU 的組合,提供更高的性能。它是 NVIDIA GB200 NVL72 的一部分,這是一個多節點、液冷的資料中心電腦系統,專為 AI 訓練和推理任務而設計。與相同數量的 NVIDIA H100 Tensor Core GPU 相比,GB200 NVL72 系統可以為 LLM 提供高達 30 倍的性能提升,同時將成本和能耗降低高達 25 倍。




超級電腦的架構

Nvidia 針對 Blackwell 提出了兩種 DGX 超級電腦的架構


The DGX B200:將 x86 CPU 搭配 B200 GPU 的架構,與現在的 H100/H200 系統相容,是 8 個 OAM + 上一個 UBB 的組合。




The DGX GB200:介紹一下 DGX GB200 的 data center 架構。

GB200,是兩個 B200 GPU 和一個 Grace CPU 的組合。




兩個 GB200 會放在一個 Tray 裡面組成一個 Blackwell computer node,其中還有 4 個 NVIDIA ConnectX-8 SuperNIC switch,一個 Bluefiled-3 DPU。




由 18 個 computer tray 放到一個 rack 中,由 36 個 Grace CPU 跟 72 個 Blackwell GPU 構成。



NVLink Switch System,由 18 個 NVLink 晶片組成。




GB200 computer nodes,18 個 GB200 tray 加上 NVLink Systeme 組合而成。




GB200 NVL72,上述的 GB200 computer nodes 加上 Quantium Inifiniband switch 還有 30TB 的 HBM3e 組合成一個大型 CUBA GPU。




GB200 NVL72 Computer Racks,8 個 GB200 NLV72 組成,等於 288 個 Grace CPU 跟 576 個 Blackwell GPU 並搭配上液態冷卻性統。




最後組成一個完整的 data center。




性能和其客戶

GB200 NVL72 系統可以支援一個 27 萬億參數的模型,遠大於 GPT-4 傳聞中的 1.7 萬億參數模型。


預計亞馬遜網路服務 AWS、戴爾科技 DELL、谷歌 Goolge、Meta、微軟 Microsoft、OpenAI、甲骨文、特斯拉和 xAI 等科技巨頭將採用新的 GPU。AWS、Google Cloud、Microsoft Azure 和 Oracle Cloud Infrastructure 等雲端服務提供商預計將提供基於 Blackwell 的實例。


寫在後面

NVIDIA 的 Blackwell 架構及其 B100、B200 和 GB200 GPU 代表了 AI 和 GPU 計算的重大進步。這些新的加速器有望在生成式 AI 和其他計算密集型應用中取得突破,提供前所未有的性能和效率。隨著這些 GPU 在今年晚些時候上市,我們可以期待看到各個行業的 AI 創新和更先進的 AI 模型的發展。


參考資料

留言

這個網誌中的熱門文章

Reddit 超強文章:使用 ChatGPT 的 Custom Instruction 提升回答品質

Forefront Chat:自由切換 GPT-3.5 和 GPT-4 聊天,現在免費!

提高投資決策效率:利用 ChatGPT 分析資產負債表

ChatGPT 可以顯示美觀數學公式:Tex All the Tings Chrome Extension

Glarity Chrome 擴充套件:使用 ChatGPT 生成 Youtube/bilibili, Google/Bing, Page Summary, Comment Summary 摘要

ChatGPT 的 GPTs 筆記 (4):GPTs Konwledge 知識庫的限制與風險

當未來和過去交錯:AI 翻譯古老楔形文字 Cuneiform

TRIZGPT:解決問題的小顧問

ChatGPT Sidebar: 全方位 AI 助手 (Chrome Extension)

Grammarly 推出 GrammarlyGo:創新的生成式 AI 寫作助手