近期,東數西算工程正式全面啟動,標志著我國算力發展邁上新臺階。
關系到數十萬億數字經濟底座的關鍵工程
新一輪科技革命和產業變革正在重塑全球經濟結構。數字經濟規模凸顯,中國信通院報告顯示,我國2020 年數字經濟規模為39.2 萬億元人民幣,數字經濟占GDP 的比重為38.60%。數字新基建是數字經濟的底層架構,算力是數字經濟的核心生產力,成為全球戰略競爭的新焦點,因而“東數西算”作為數字新基建的關鍵工程而至關重要。
萬億市場新風口
“東數西算”是數字經濟產業鏈中至關重要的一環。數字經濟產業鏈上游主要為基礎設施等底層架構,包括數據中心、5G 等;數字經濟中游圍繞數字產業化展開;數字經濟下游圍繞產業數字化展開?;谏嫌蔚幕A設施,通過中游的各類應用為下游的各類場景提供全面的數字化服務。
“東數西算”每年帶動社會4000 億元直接投資。對相關產業拉動效應會達到1:8,相當于直接撬動3 萬億的市場。4000 萬億的投資本身主要包括土建、主干網絡及5G 建設、數據中心升級和建設、云計算。撬動的萬億市場主要圍繞產業數字化展開,主要包括工業互聯網、人工智能、大數據、物聯網、數據中心和5G 網絡核心芯片、云網融合、車聯網、數字孿生、元宇宙、ARVR、異構算力網絡、新能源和碳中和。
2030 年我國數據中心將帶來2 億噸的碳排放量
數據量和算力在以20% 的年增長率增長,數字經濟占比持續提高。據相關部門統計,到2025 年數據創建總量將大幅增長至175ZB,復合年均增長率約為26%?,F在每小時創建的數據比過去20 年前一整年創建的數據還多。同時全社會對算力需求也十分迫切,截至2022 年1 月,中國數據中心規模已達500 萬標準機架,算力達到130EFLOPS(每秒一萬三千億億次浮點運算),預計每年仍將以20% 以上的速度快速增長。
數據中心碳排放也在不斷突破更高上限,能源供給不斷承壓。據開放數據中心委員會ODCC 數據顯示,2020 年中國數據中心能耗總量為939 億千瓦時,碳排放量為6464 萬噸。預計到2030 年,中國數據中心能耗總量將達到3800 億千瓦時左右,碳排放增長率將超過300%。如果不使用綠色能源,碳排放總量將突破2 億噸,占全國總碳排放量的2% 左右。目前中國數據中心的碳排放占全社會比例較全球平均水平高出一倍,減碳勢在必行。
“東數西算”與經濟一同減碳
既往數據中心布局和能源布局存在錯配。根據《2021 年中國數據中心市場報告》顯示,全國范圍內累計數據中心存量機柜總數中,華東、華北、華南占比達到79%,我國大部分的數據中心都集中在東部。而西部地區的土地資源和電力資源更加豐富,數據中心需求卻不高,且電費明顯低于東部地區。數據中心能源結構亟待改變。2020 年,全國數據中心共耗電2045 億千瓦時,占全社會用電量的2.7%。預計到2025 年,這個值將達到3952 億千瓦時,占比將提升至4.05%,“不冒煙的鋼廠”之名名不虛傳。當前中國的電力結構仍以燃煤發電為主,在數據中心供電結構中,火電占比超過70%,會產生大量的溫室氣體及其他污染物,數據中心綠電使用率仍不到20%。
西部具備成為算力樞紐和集群的天然優勢。例如,寧夏中衛的水電、光伏電站、風電等清潔能源裝機比例超過50%,現有實際折算電價成本約0.34 元~0.36 元/ 千瓦時,與東部相比降低了20% 以上。貴安新區全年氣溫保持在14℃左右,水資源豐富,可為數據中心提供穩定的水冷支持。通過“東數西算”將算力遷移到綜合能源成本更低的西部地區,在西部就地消納光伏、風電等綠電,使用水冷技術節電,有望將數據中心綠電使用率在未來提高至80%,既能提升國家整體算力水平,也能符合雙碳要求,支撐數字經濟可持續發展。
20 萬公里/s、100Gbps 以及N 到1
算力是“東數西算”工程產出的核心生產力,算網融合、端網融合以及下一代原生數據中心是支撐算力上臺階的核心技術。算網融合存在并作用于數據中心與數據中心之間,以及數據中心與邊緣端/ 終端之間;端網融合存在并作用于數據中心內部;下一代原生數據中心則是數據中心的變革方向。
算網融合是“東數西算”的“大動脈”
算網融合用最少時延和最優網絡方案輸送云算力。在光通信時代,光在光纖中的傳播速度是20 萬公里/s;在算網融合時代,算力的傳播速度是否也能接近20 萬公里/s,會是一個有意義的話題。電信運營商是寬帶時代的基礎設施主要提供商,提供網絡;而互聯網大廠則是初代云時代的基礎設施主要提供商,提供算力;面向未來,算網融合的網絡基礎設施提供算力網絡,用最少的時延將算力輸送到目的地。作為“算力+ 網絡”協同發展的關鍵點,算網融合強調了借助信息通信網絡協同異構算力資源,通過智能化技術實現計算能力的統一調度和編排,全面重構網絡服務方式和計算模式,是“東數西算”的大動脈?!皷|數西算”也對算網融合提出新的技術要求。從架構上,需要改變當前以地域為中心的布局方式,做到以算力為中心布局;從互聯互通上,需要提升云間鏈路的帶寬,降低云間傳送的時延;從網絡本身來看,需要就近、最優發放算網資源。
端網融合是“東數西算”的“毛細血管”
數據中心內部100Gbps 網絡造成DatacenterTax 巨大。數據中心雖然可以在邏輯上被視為一臺計算機,但其中的節點是需要通過網絡互連的。計算的分配、存儲的共享、硬件資源的虛擬化等,都將成為整合數據中心資源的開銷。而數據中心的CPU 和GPU 都不是針對數據中心的這些負載來設計的,諸如網絡協議處理、存儲壓縮、數據加密會過多地占用CPU 和GPU 的算力,使有效算力降低。以網絡協議處理為例,要處理10Gbps 的網絡,需要大約4 個Xeon CPU的核,相當于單是做網絡數據包處理,就會占去一個8 核高端CPU 的一半的算力。如果考慮100Gbps、200Gbps 的高速網絡,CPU性能的開銷就更加難以承受了。Amazon 把這些開銷都稱之為“Datacenter Tax”——還未運行業務程序,先接入網絡數據就要占去的計算資源。端網融合可以為數據中心網絡帶來高帶寬和低延時的價值此外更重要的還可以卸載CPU 的非計算能力,使數據中心有效算力提升,打通數據中心內部的“毛細血管”。
“東數西算”深度推動下一代數據中心迭代和落地
截屏2022-05-16 09.53.55.png
下一代原生數據中心
數據中心的發展經歷了IT 機房、IT 數據中心和下一代數據中心三個階段。IT 機房階段,依賴單核和單機堆積高算力,從1 臺主機對外服務,演變為n 臺主機對外服務,實現了1 到n;IT 數據中心階段,出現了Hadoop 等云計算架構和系統,可以統籌更多的N,每臺服務器由Hadoop 等云架構來協調和分配任務,實現了n 到N;下一代數據中心是原生的、由軟件定義的數據中心,其中CPU、GPU、XPU、FPGA 等高效異構計算資源、內存資源、存儲資源、網絡IO 資源等全部虛擬和資源池化,可軟件定義,實現“The Datacenter as a Computer(DAAC)”,也即N 到1 的狀態。隨著“東數西算”工程的深入推進,軟件和硬件廠商將更多地參與進來,共同構建一個原生的下一代數據中心。