輝達最新架構 Blackwell GPU ,AI領頭時代,GTC 大會正式揭開了最新架構。

2024 年的科技市場再度掀起一波震撼,全球 AI 晶片巨頭輝達(NVIDIA)在年度 GTC 大會中,正式揭開了最新 GPU 架構 —— Blackwell 系列的神秘面紗。這次的 Blackwell 系列,無論在電晶體數量、記憶體性能,還是功耗控制方面,都大幅超越前代 Hopper 架構,不僅讓輝達在技術上再次拔得頭籌,也將推動下一波 GPU 產業的發展。

1. Blackwell 系列 GPU 的誕生

Blackwell 架構是輝達用以接替 Hopper 架構的全新一代技術,並以著名統計學家 David Harold Blackwell 的名字命名。這次的晶片架構,擁有高達 2080 億個電晶體,並採用台積電 4 奈米製程技術打造。Blackwell GPU 配備了 10TB/秒的晶片到晶片互連技術,使多個 GPU 之間能夠高效合作,從而加速 AI 模型的訓練與運行,無疑成為生成式 AI 應用的強大後盾。

輝達執行長黃仁勳表示,生成式 AI 是當今技術浪潮的關鍵,而 Blackwell 系列將成為 AI 行業的新引擎。此次大會上,輝達推出了兩種主要晶片:B100 和 B200,並發布了集成兩個 B200 GPU 和一個 Grace Arm 伺服器 CPU 的強力晶片——GB200。

2. Blackwell GPU 的五大特色

Blackwell 系列晶片帶來的技術創新主要體現在五個關鍵特點上:

特點一:電晶體數量提升

B100 與 B200 晶片配備兩顆晶片,每顆晶片各含 1040 億個電晶體,總計 2080 億顆電晶體,與前代 H100 相比,提升了 30% 的電晶體密度。這樣的增幅,意味著更高效的圖形解析與更複雜的運算能力,特別是在深度學習模型的運行和高畫質影像處理方面,Blackwell 將帶來前所未有的性能提升。

特點二:HBM3e 記憶體堆疊技術

Blackwell 系列 GPU 配備了高達 192GB 的 HBM3e 記憶體,透過 8 層堆疊技術實現 8TB/秒的總頻寬。這樣的記憶體規格和傳輸速度,是 H100 系列的 2.4 倍,無論是數據的讀寫速度還是記憶體容量,均有顯著提升。這意味著 Blackwell 能更好地應對複雜 AI 模型的運算需求,縮短訓練時間。

特點三:第二代轉換器引擎

輝達在 Hopper 架構上首度推出了轉換器引擎 (Transformer Engine),允許混合高精度和低精度運算。在 Blackwell 系列中,這一技術得到進一步升級,支持更低的 FP4 和 FP6 精度運算,進一步降低了資料處理時間,這對於推論階段的 AI 模型運行尤為重要。相比之下,競爭對手 AMD 的 MI300X 和英特爾的 Gaudi 3 並不支持如此低精度的運算,這使得 Blackwell 在運算效率上更具優勢。

特點四:第五代 NVLink 互連技術

Blackwell GPU 搭載了更新的 NVLink 5 技術,頻寬從前代 Hopper 的 900GB/秒提升至 1800GB/秒。儘管每個 GPU 的 NVLink 數量保持不變,但由於傳輸速率的提升,整體頻寬實現了翻倍。這項技術使得晶片之間的數據傳輸更加高效,為 AI 模型的大規模訓練提供了強力支持。

特點五:雙晶片設計

Blackwell 系列晶片設計配備兩顆 GPU 晶片,實現了超高的運算能力。B100 晶片雖在性能上稍遜於 B200,但仍能提供超過 H100 GPU 80% 的運算吞吐量,且在功耗上更具優勢。相較之下,B200 和 GB200 的熱設計功率 (TDP) 分別高達 1000 瓦和 2700 瓦,使得它們在能耗上的表現成為市場關注的焦點。

3. 市場前景與競爭優勢

輝達 Blackwell 系列的發布,無疑對競爭對手 AMD 和英特爾形成了巨大的壓力。AMD 的 MI300X 雖在電晶體數量和記憶體規格上與 Blackwell 系列相當,但在運算精度、頻寬速度及整體性能上仍略遜一籌。英特爾的 Gaudi 3 則更難以與 Blackwell 抗衡,其在電晶體數量和轉換器引擎方面均不具備競爭力。

然而,AMD 和英特爾並未完全喪失競爭優勢,特別是在價格方面,兩家公司擁有較大的靈活性。AMD 的 MI300X 售價大約為 1 萬美元,而英特爾 Gaudi 3 的預估價格落在 1 萬 5 至 2 萬美元之間,這與 Blackwell 的 B200 晶片 3 萬至 4 萬美元的高價相比,無疑具有價格優勢。對於預算有限的企業,這兩家公司的產品仍然具備吸引力,特別是在 GPU 市場供應緊張的當下。

4. 結語

輝達 Blackwell 系列無論在技術創新還是市場影響力上,都將成為未來 AI 計算領域的關鍵推動力。雖然價格較高,且功耗較大,但對於那些尋求高效能運算解決方案的企業來說,Blackwell 無疑是最佳選擇。隨著 AI 產業的迅速發展,輝達預計將藉此再度擴大其在高端市場中的份額,並引領下一波 AI 技術的變革。

而對於競爭者來說,儘管技術層面稍有落後,但以價格優勢切入中低端市場仍具潛力。在未來的市場格局中,輝達將持續扮演領頭羊角色,而 AMD 和英特爾則將在不同的市場定位中爭奪生存空間。