Supermicro 的端到端液冷解決方案,利用 NVIDIA Blackwell 平臺推動行業(yè),向可持續(xù)的人工智能數(shù)據(jù)中心過渡
加利福尼亞州圣何塞2024年10月17日 /美通社/ -- Supermicro, Inc.(納斯達克:SMCI)是人工智能 (AI)、云端、存儲和 5G/Edge 的整體 IT 解決方案提供商正在利用 NVIDIA Blackwell 平臺,向液冷數(shù)據(jù)中心加速過渡,為新人工智能基礎設施快速增長的能源需求提供新的能效模式。Supermicro 業(yè)界領先的端到端液體冷卻解決方案,由 NVIDIA GB200 NVL72 平臺提供支持,可在單機架上進行百萬兆級計算,并已開始向部分客戶提供樣品,并將于第四季度末全面投產(chǎn)。此外,最近發(fā)布的 Supermicro X14、H14 4U 液冷系統(tǒng)以及 10U 風冷系統(tǒng)已準備就緒,可用于 NVIDIA HGX B200 8-GPU 系統(tǒng)。
Supermicro 總裁兼首席執(zhí)行官 Charles Liang 表示:"我們正在推動可持續(xù) AI 計算的未來,我們的液冷 AI 解決方案,正在被世界上一些最具野心的 AI 基礎設施項目爭相采用,自 2024 年 6 月以來已出貨的液冷機架計有 2,000 多個。" "Supermicro 的端到端液體冷卻解決方案采用 NVIDIA Blackwell 平臺,可釋放下一代 GPU 的計算能力、成本效益和能效,例如 NVIDIA GB200 NVL72(單個機架中的超大規(guī)模計算機)的計算能力、成本效益和能效。Supermicro 在部署液冷 AI 基礎設施方面的豐富經(jīng)驗,以及全面的現(xiàn)場服務、管理軟件和全球制造能力,為客戶在使用最強大、最可持續(xù)的 AI 解決方案改造數(shù)據(jù)中心方面提供了明顯的優(yōu)勢。"
https://www.supermicro.com/en/solutions/ai-supercluster
Supermicro 為基于 NVIDIA GB200 NVL72 平臺的系統(tǒng)推出的液冷超級集群,采用全新的先進機架內或行內冷卻劑分配單元 (CDU),以及定制冷板,用于在 1U 外形中容納兩個 NVIDIA GB200 Grace Blackwell 超級芯片的計算托盤。Supermicro 的 NVIDIA GB200 NVL72 利用 Supermicro 的端到端液冷解決方案,在單個機架中實現(xiàn)了超大規(guī)模 AI 計算能力。該機架解決方案,集成了 72 個 NVIDIA Blackwell GPU 和 32 個 NVIDIA Grace CPU,通過 NVIDIA 第五代 NVLink 網(wǎng)絡互連。NVIDIA NVLink 交換機系統(tǒng),以極低的延遲實現(xiàn)每秒 130 太字節(jié) (TB/s) 的 GPU 總通信量,從而增強了人工智能和高性能計算 (HPC) 工作負載的性能。此外,Supermicro 支持最近發(fā)布的 NVIDIA GB200 NVL2 平臺,采用緊密耦合的兩顆 NVIDIA Blackwell GPU 和兩顆 NVIDIA Grace CPU 的 2U 風冷系統(tǒng),適合輕松部署各種工作負載,如大型 LLM 推理、檢索增強生成 (RAG)、數(shù)據(jù)處理和高性能計算 (HPC) 應用。
Supermicro 領先的 4U 液冷系統(tǒng)和全新的 10U 風冷系統(tǒng),現(xiàn)已支持 NVIDIA HGX B200 8-GPU 系統(tǒng),并可投入生產(chǎn)。新開發(fā)的冷板和 250kW 容量的機架內冷卻劑分配裝置,最大限度地提高了 8 GPU 系統(tǒng)的性能和效率,在一個 48U 機架內可提供 64x 1000W NVIDIA Blackwell GPU 和 16x 500W CPU。最多 4 個全新 10U 風冷系統(tǒng)可以安裝并完全集成到機架中,其密度與上一代相同,同時提供高達 15 倍的推理和 3 倍的訓練性能。
SuperCloud Composer 軟件是 Supermicro 的綜合數(shù)據(jù)中心管理平臺,提供強大的工具,用于監(jiān)控有關液冷系統(tǒng)和機架、冷卻劑分配裝置和冷卻塔的重要信息,包括壓力、濕度、泵和閥門狀況等。SuperCloud Composer 的液體冷卻咨詢模塊 (LCCM),冇助優(yōu)化液體冷卻數(shù)據(jù)中心的運營成本并管理其完整性。
Supermicro 為數(shù)萬億參數(shù)的人工智能模型擴展基礎架構,走在采用 InfiniBand 和以太網(wǎng)創(chuàng)新網(wǎng)絡技術的前沿,包括 NVIDIA BlueField®-3 SuperNIC 和 400Gb/s 的 NVIDIA ConnectX®-7、NVIDIA ConnectX®-8、Spectrum?-4 和 NVIDIA Quantum-3 為 NVIDIA Blackwell 平臺提供 800Gb/s 的網(wǎng)絡連接。NVIDIA Spectrum-X? Ethernet 與超微公司的 4U 液冷和 8U 風冷 NVIDIA HGX H100 和 H200 系統(tǒng)集群配合使用,現(xiàn)在為迄今為止最大的 AI 部署之一提供動力。
Supermicro 是一站式商店,從概念驗證 (PoC) 到全面部署,提供所有必要的技術、液體冷卻、網(wǎng)絡解決方案和現(xiàn)場安裝服務。Supermicro 提供全面的、內部設計的液體冷卻生態(tài)系統(tǒng),包括針對各種 GPU、CPU 和內存模塊進行了優(yōu)化的定制冷板,還有多種 CDU 外形和容量、歧管、軟管、連接器、冷卻塔以及監(jiān)控和管理軟件。這種端到端解決方案無縫集成到機架級配置中,顯著提高系統(tǒng)效率,緩解熱節(jié)流,同時降低數(shù)據(jù)中心運營的總體擁有成本 (TCO) 和對環(huán)境的影響,以迎接人工智能時代的來臨。
Supermicro 參加 2024 OCP Global Summit
2024 年 10 月 15 日至 17 日,請在加利福尼亞州圣何塞 OCP Global Summit 的 #21 號展位了解更多信息。
關于 Super Micro Computer, Inc.
Supermicro(納斯達克股票代碼:SMCI)是應用優(yōu)化整體IT解決方案的全球領軍企業(yè)。Supermicro 成立于加州圣何塞并在該地運營,致力于為企業(yè)、云計算、AI 和 5G 電信/邊緣 IT 基礎設施提供創(chuàng)新,并爭取搶先一步上市。我們是一家提供服務器、人工智能、存儲、物聯(lián)網(wǎng)、交換機系統(tǒng)、軟件和支持服務的整體 IT 解決方案提供商。Supermicro 的主板、電源和機箱設計方面的專業(yè)知識推動了我們的研發(fā)和生產(chǎn),為全球客戶提供了從云端到邊緣的下一代創(chuàng)新技術。我們的產(chǎn)品均在公司內部(包括美國、亞洲和荷蘭)完成設計和制造,通過全球運營實現(xiàn)規(guī)模和效益,從而優(yōu)化總體擁有成本(TCO),并能夠(通過綠色計算)減少對環(huán)境的影響。獲獎無數(shù)的Server Building Block Solutions®通過我們靈活可重復使用的構建塊,為客戶提供了豐富的可選系統(tǒng)產(chǎn)品系列,用于優(yōu)化其確切的工作負載和應用。這些構建塊支持全系列外形規(guī)格、處理器、內存、GPU、存儲、網(wǎng)絡、電源和冷卻解決方案(空調、自然空氣冷卻或液體冷卻)。
Supermicro、Server Building Block Solutions和We Keep IT Green是Super Micro Computer, Inc.的商標和/或注冊商標。
所有其他品牌、名稱和商標均為其各自所有者所有。