北京2023年8月16日 /美通社/ -- 8月10日,在OCP China Day 2023(開放計算中國技術峰會)上,浪潮信息重磅發(fā)布融合架構3.0原型系統(tǒng),以開創(chuàng)性的系統(tǒng)架構設計實現(xiàn)了計算資源、存儲資源、內存資源、異構加速資源等核心IT資源徹底解耦與池化,支持池化資源異步升級、支持細粒度多主機共享高并發(fā)存儲、亞微秒級遠端內存共享訪問等特性,可通過軟件定義實現(xiàn)"一套系統(tǒng),N類應用"。
融合架構3.0原型系統(tǒng)的發(fā)布,將有望發(fā)展出一種全解耦、全池化、高可擴展、易部署、易管理的新型硬件基礎架構,緩解馮·諾依曼架構瓶頸,實現(xiàn)軟硬高度協(xié)同,加速數(shù)據中心釋放數(shù)字生產力,促進數(shù)字經濟發(fā)展以及與實體經濟的深度融合。
多數(shù)字技術融合亟需硬件基礎架構創(chuàng)新
當前,數(shù)字化、智能化轉型已成為企業(yè)發(fā)展、科研創(chuàng)新和社會治理的剛性需求,也催生了云計算、大數(shù)據、人工智能等數(shù)字技術的蓬勃發(fā)展。然而,越來越多樣化的應用對底層硬件資源的需求存在差異,導致使用傳統(tǒng)架構的云、數(shù)、智、邊、端等各類技術平臺彼此獨立,硬件資源難以共享復用,造成資源浪費的同時也使得運維管理難度激增。
同時,應用數(shù)量的增多以及應用規(guī)模的擴大,也在進一步推動數(shù)據中心向集中化、規(guī)?;l(fā)展。即便數(shù)據中心已普遍采用分布式架構,但設備間的互連網絡帶寬遠低于主板內和設備內的互連帶寬,并且網絡協(xié)議復雜、層次眾多,協(xié)議的轉換和處理占用了大量系統(tǒng)資源,使得業(yè)務系統(tǒng)擴展性受到嚴重限制,需要一種可擴展性更優(yōu)、易管理性更好的硬件基礎架構,從而實現(xiàn)數(shù)據中心的輕松擴容。
此次浪潮信息發(fā)布的融合架構3.0原型系統(tǒng),通過系統(tǒng)架構創(chuàng)新解耦重構服務器系統(tǒng),突破性實現(xiàn)了計算資源、存儲資源、內存資源、異構加速資源等核心IT資源徹底解耦與池化,可支持多種通用處理器平臺與GPU、FPGA、DPU等多種異構加速單元的協(xié)同計算,并可通過軟件定義實現(xiàn)資源協(xié)同動態(tài)調度。這種基于硬件重構技術而開發(fā)的新一代基礎架構,將實現(xiàn)更加自由的資源隨需定義,為上層軟件定義系統(tǒng)提供更出色的靈活性,使其能夠根據應用特點,以高度自動化的方式分配與重新配置硬件資源,不再受到非動態(tài)設置的硬件基礎設施的限制,讓數(shù)據中心內部的人工智能、科學計算、云計算、大數(shù)據等各類應用統(tǒng)一運行于同一架構之上,實現(xiàn)多技術平臺融合,加速業(yè)務創(chuàng)新及數(shù)字化轉型。
融合架構3.0原型系統(tǒng)顛覆傳統(tǒng):一套架構,N類應用
"一套架構,N類應用"是融合架構3.0原型系統(tǒng)的核心價值所在。一切數(shù)字化、一切智能化,實際上是物理世界和數(shù)字世界逐步深度融合的過程,需要多種多樣的數(shù)字技術支撐,但不同的技術對硬件架構的要求不同,各技術平臺之間很難實現(xiàn)資源共享復用。比如,以大模型為代表的AIGC技術需要基于海量數(shù)據集,在擁有成百上千AI加速卡的集群上對千億級參數(shù)的AI大模型進行分布式訓練,對異構算力的需求更高;科學計算要求更高的計算精度,對通用算力的需求更高;內存計算則希望讓更多應用程序的數(shù)據駐留在內存之中,使得數(shù)據和算力更接近,以提高處理速率,對內存容量要求更高。但傳統(tǒng)架構下,IT資源的擴展是以整機形態(tài)來完成的,即便用戶亟需的是某種特定資源,但仍然需要為整機附帶的額外資源付費,這勢必增加了IT支出并造成資源閑置浪費。
融合架構3.0原型機打破了以往"以CPU為中心"的設計理念,而是從整體出發(fā),以系統(tǒng)為中心,通過硬件解耦將異構計算、內存、存儲等資源轉變?yōu)榭瑟毩U展的資源池,用戶可以根據應用需求實現(xiàn)資源自由擴展。其中,內存解耦不僅實現(xiàn)了亞微秒級遠端內存訪問,并且構建出一種邏輯上可遠端共享的內存資源池,讓多臺主機訪問同一個內存池,大大提高數(shù)據交換的效率,讓Spark、Hadoop和機器學習等使用分布式數(shù)據框架的應用,能夠更順暢地實現(xiàn)框架內各節(jié)點間的數(shù)據交換與協(xié)作,顯著提升數(shù)據處理效率。同時,內存解耦解除了與主機的綁定,也能讓大規(guī)模、超大規(guī)模數(shù)據中心通過減少孤置的內存來提高內存資源的利用率,實現(xiàn)動態(tài)內存擴展,從而降低成本支出。此外,內存池化共享還可以通過本地和遠端的內存,開發(fā)更多高級數(shù)據功能,比如內存數(shù)據流動或者內存數(shù)據高可用技術等。
融合架構3.0原型系統(tǒng)采用整機柜形態(tài),所有的主機與資源均通過統(tǒng)一的管理、散熱、供電實現(xiàn)高度集成,整體形成一個異構高算力、I/O資源和內存資源可按需拓展,資源靈活調度分配的新型"服務器"。其中,多層次多協(xié)議整系統(tǒng)管理、高壓直流供電和負壓真空CDU液冷等創(chuàng)新技術的開發(fā)應用,在實現(xiàn)數(shù)據中心細粒度、智能化管理的同時,也極大緩解了大量使用高功耗處理器引發(fā)的"功耗墻"問題。
融合架構是浪潮信息于2014年提出的技術理念,核心在于通過硬件解耦實現(xiàn)資源的物理池化和動態(tài)重構,通過軟件定義實現(xiàn)業(yè)務感知的按需資源組合與配置,滿足系統(tǒng)的彈性伸縮和超大規(guī)模的持續(xù)擴展,實現(xiàn)軟硬高度協(xié)同發(fā)展。浪潮信息將融合架構的發(fā)展劃分為三個階段,分別為 "服務器即計算機(Server as a Computer)" ,"機柜即計算機(Rack as a Computer)"以及最終的"數(shù)據中心即計算機(Data Center as a Computer)"。此次融合架構3.0原型系統(tǒng)的發(fā)布,意味著浪潮信息正向融合架構的終極目標邁進。