北京2023年7月12日 /美通社/ -- 7月11日,浪潮信息聯(lián)合英特爾發(fā)布面向生成式AI領(lǐng)域創(chuàng)新開發(fā)的新一代AI服務(wù)器NF5698G7。該AI服務(wù)器支持8顆OAM高速互聯(lián)的Gaudi2加速器,具備高性能、高擴(kuò)展、高能效和開放生態(tài)等優(yōu)點(diǎn),將為AI客戶提供強(qiáng)大的大模型訓(xùn)練和推理能力。
浪潮信息NF5698G7在6U空間支持8顆基于開放加速模組OAM高速互聯(lián)的Gaudi2 AI加速器,每顆Gaudi2芯片配置96GB HBM高速內(nèi)存,共提供2.1Tbps的P2P互聯(lián)帶寬,支持全互聯(lián)拓?fù)洌瑵M足大模型訓(xùn)練張量并行的通信需求;搭載2顆第四代至強(qiáng)處理器,支持AMX/DSA等AI加速引擎。Gaudi2是英特爾推出的深度學(xué)習(xí)加速器,以多方位性能與能效比提升,為業(yè)界提供了高性能、高性價(jià)比的AI算力選項(xiàng),在MLPerf的GPT-3、ResNet-50、Unet3D、BERT等基準(zhǔn)測試中,均取得了優(yōu)異的性能表現(xiàn)。
NF5698G7采用高擴(kuò)展設(shè)計(jì),支持12個(gè)PCIe5.0 X16的IO擴(kuò)展,最大支持4800Gbps節(jié)點(diǎn)間互聯(lián)帶寬,滿足大模型流水線并行和數(shù)據(jù)并行的通信需求,可擴(kuò)展至萬卡AI集群。NF5698G7通過精細(xì)化分區(qū)、智能散熱調(diào)控、12V & 54V N+N雙輸入供電等創(chuàng)新設(shè)計(jì),實(shí)現(xiàn)高功率負(fù)載動態(tài)匹配和低電源功率損耗,系統(tǒng)功耗降低8%。
NF5698G7基于全球開放計(jì)算OCP開放加速器規(guī)范 OAM/UBB進(jìn)行產(chǎn)品設(shè)計(jì),支持PyTorch、TensorFlow等主流AI框架和Megatron/DeepSpeed等流行開發(fā)工具,為生成式AI提供成熟、高性價(jià)比的開放生態(tài)產(chǎn)品方案。NF5698G7支持浪潮信息的AI算力資源平臺AIStation,通過對計(jì)算資源、數(shù)據(jù)資源、深度學(xué)習(xí)軟件棧資源進(jìn)行統(tǒng)一管理,有效提升大模型算力平臺的使用效率,助力客戶加速AI大模型開發(fā)與部署。
浪潮信息高級副總裁、AI&HPC產(chǎn)品線總經(jīng)理劉軍表示:"NF5698G7為生成式AI應(yīng)用提供了極具吸引力的AI算力平臺,我們與英特爾緊密協(xié)作,優(yōu)化了NF5698G7在多種生成式AI場景的性能表現(xiàn),為AI客戶提供強(qiáng)大的大模型訓(xùn)練和推理能力,加速AIGC創(chuàng)新步伐、賦力生成式AI產(chǎn)業(yè)創(chuàng)新。"
英特爾執(zhí)行副總裁兼數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理Sandra Rivera表示:"英特爾致力于提供基于至強(qiáng)處理器和 Gaudi 深度學(xué)習(xí)加速器的業(yè)界領(lǐng)先的人工智能解決方案,以及開放、安全且易于編程的軟件,降低AI應(yīng)用門檻,讓AI惠及所有人。對尋求高性能和高性價(jià)比的客戶來說,浪潮信息 NF5698G7 是絕佳選擇。我們將繼續(xù)與浪潮信息合作,在人工智能時(shí)代不斷創(chuàng)新。"
浪潮信息是全球領(lǐng)先的AI服務(wù)器廠商。據(jù)IDC數(shù)據(jù)報(bào)告顯示,浪潮信息在中國AI服務(wù)器市場份額連續(xù)六年保持第一。