跳到主要內容

發表文章

目前顯示的是有「高效能運算」標籤的文章

了解OAI-UBB:通用基板 UBB 的 PCB 設計

開放式加速器基礎設施 (Open Accelerator Infrastructure,OAI)  在高效能運算 (High-Performance Computing,HPC)、機器學習和深度學習的領域中,開放式加速器基礎設施 (OAI) 是其中一項重點任務。它是 OCP (Open Compute Project) 伺服器專案的一部分,目的是為了建立一個模組化、可協作的架構。OAI 詳細描述了在設計加速器系統時關鍵的邏輯和物理層面,這對於推進計算能力相當重要。OAI 的 building block 如下圖所示,本文主要探討與 PCB 強相關的 UBB 通用基板。 OAI 通用基板 (OAI-UBB,Universal Baseboard) 通用基板 (UBB) 標準是泛用和創新的象徵。它的設計為了支援現有和未來的 OAM 模組,為各種系統架構提供無與倫比的設計多樣性。 UBB 基板主要被規劃為 5 大區塊,OAM Support,Interface to HIB (Host Interface Board),EXP Capabilities,Electrical Interoperability,Mechanical Interoperability。 PCB 相關的設計特徵 基板尺寸:417mm x 655mm,大約是 16.5” x 25.8”。這種 PCB 尺寸對於傳統 PCB 發料基板尺寸 21” x 24” 是一大挑戰,生產 OAI-UBB 需要有對應大型發料尺寸的製程能力。 疊構:30L,並使用 800G Ultra low-loss 的材料。為了可以達到高速訊號與大電源傳輸的需求,疊構設計一般依循以下原則: 多張 core 的組合設計 4 層以上的 2oz 銅厚設計 背鑽 (back-drill) 技術使用:移除訊號的 stub 以及為了 press-fit 使用。 整體板厚約 160mil,4mm 左右 高電壓電源的 Layout 設計:每個 OAM 都透過專用的熱交換控制器從 54V/48V 獨立供電。 在熱交換控制器 / 保險絲之前的佈局建議 具有高電位差異(>40V)的導體之間的最小間距 內層:25 mils (0.64mm) 外層:120 mils (3.0mm) 層間:17 mils (0.43mm) 間距或 3 層 P...

AMD 對 Nvidia 挑戰:MI300X 和 MI300A 加速器

AMD 推出 MI300X 和 MI300A 在 AI 和高效能運算(HPC)迅速發展的現在,AMD 推出 Instinct MI300X 加速器和 MI300A 加速處理單元(APU),正式挑戰 Nvidia 的霸主地位。這些產品充份的展現了 AMD 挑戰 Nvidia 在 AI 晶片市場主導地位的野心。 Instinct MI300X:AI 加速的新 Benchmark Instinct MI300X 以其強大的生成 AI 工作負載和 HPC 應用能力脫穎而出。基於 AMD 先進的 CDNA™ 3 架構,配置了 304 個 GPU 和 192 GB HBM3 記憶體。MI300X 的配置讓它在 AI 訓練工作負載上的表現比前代產品提升約 6.8 倍,使其在 AI 晶片領域成為一股強大的力量。 MI300X 與 Nvidia:設立新標準 MI300X 最顯著的一點是其與 Nvidia 的 H100 晶片的性能比較。在訓練和運行大型語言模型(LLMs)方面,MI300X 不僅匹敵,還超越了 H100,特別是在推理任務上。這證明了 AMD 努力於推動 AI 晶片性能的極限。 Instinct MI300A:連接 AI 與 HPC MI300A APU 是 AMD 同步推出的的另一項產品,目的是為了加速 AI 與 HPC 的融合。它結合了 AMD Instinct 加速器和 AMD EPYC™ 處理器的功能,提供 228 個 GPU 運算單元和 128 GB 統一 HBM3 記憶體。這種整合帶來了增強的效率、靈活性和可編程性,使 MI300A 成為多種運算需求的多功能解決方案。 對數據中心和超級計算的影響 MI300X 和 MI300A 預計將對數據中心運營和超級計算電腦帶來革命性的變化。特別是 MI300A,預計將為勞倫斯利弗莫爾國家實驗室的 El Capitan 超級計算機提供超過兩 exaflops 的性能。這一部署凸顯了 AMD 新晶片在推進科學研究和高效能運算方面的潛力。 AMD 的戰略合作夥伴關係和市場擴張 AMD 與 Microsoft 和 Meta 的合作突顯了這些新產品的戰略重要性。MI300X 整合到 Azure 虛擬機器中,並部署在 Meta 的數據中心,標誌著 AMD 在雲計算和數據中心市場中影響力的擴大。 寫在後面:AMD 在 AI 晶片市場的...