在第一波云端AI算力的暴漲中,GPU是當仁不讓的王者,此外,還有各種針對深度學習等工作負載打造的專用AI芯片也迎來大發(fā)展。
不過,通信和計算就好比數(shù)據中心的兩個臂膀,如果一直提升算力,但是通信基礎設施跟不上,整體系統(tǒng)性能還是受限,無法發(fā)揮出真正的潛能。這也是為什么,業(yè)界越來越多在談論算網一體化、算網融合等等。
從數(shù)據中心長期的迭代方向來看,光網絡的鋪設、通信的密度、底層算力的生態(tài)設施建設等,都在逐漸升級的過程中。帶寬不斷提升,將有更大的數(shù)據量涌入,數(shù)據的處理將會越來越復雜,包括網絡協(xié)議處理、存儲壓縮、數(shù)據加密等,這些本不是CPU和GPU擅長的領域,該由誰來處理?DPU的提出背景就是應對這些數(shù)據量和復雜性的指數(shù)級增長,作為專注于解決算力基礎設施層各種數(shù)據流量負載的芯片,它被寄予了數(shù)據中心三大支柱芯片之一的定位。
國際上,英偉達、英特爾、AMD、微軟等廠商都已經在積極布局DPU,國內這個賽道的熱度也在不斷上升,產品成熟度越來越好。
脫胎于中科院計算所計算機體系結構國家重點實驗室的中科馭數(shù),是國內較早進行DPU芯片研發(fā)的企業(yè)。日前,中科馭數(shù)發(fā)布了最新一代DPU芯片K2 Pro、軟件開發(fā)平臺HADOS、以及一系列針對數(shù)據中心基礎設施層業(yè)務痛點打造的DPU卡,意在重新定義DPU,解鎖更廣泛目標場景。
為什么重新定義DPU?
在復雜大型芯片每代產品普遍3~5年的研發(fā)周期中,中科馭數(shù)用6年時間,完成了三代芯片的迭代,平均每代芯片迭代僅為不到2年的時間。
中科馭數(shù)CEO鄢貴海表示,DPU是當下算力基礎設施的核心創(chuàng)新之一,就好比數(shù)據網絡的高鐵時代,已經不僅僅是連通城市的問題,而是徹底重構了地理位置的邏輯距離。作為一家創(chuàng)新性企業(yè),中科馭數(shù)必須用一年走過別人三年的路,才有可能在市場競爭中贏得生存空間。
如何重新定義DPU,鄢貴海提出了兩個主要維度:第一,DPU的定義需要層次化,不應只局限于芯片開發(fā),而是需要在芯片、軟件和平臺上同時發(fā)展;第二,不應該用“DPU幫助卸載CPU工作負載”的狹義視角去看它,而應該是更廣。他強調,DPU能夠處理GPU和CPU都無法有效處理的任務,如安全業(yè)務和分布式安全機制。考慮到分布式和大規(guī)模集群系統(tǒng)的需求,DPU也被視為實現(xiàn)算網融合的關鍵組件。
中科馭數(shù)的目標是為算力基礎設施提供DPU產品,解決算力資源的彈性擴展、高效互連、加速計算、統(tǒng)一運維等關鍵問題,打通數(shù)據中心算力的——“堰塞湖”。基于此,中科馭數(shù)從三個維度重新定義了DPU價值:第一,架構決勝,用先進的芯片架構重新定義DPU芯片架構;第二,軟件護城,用最高兼容性來重新定義DPU的軟件系統(tǒng);第三,平臺上門,用最低的成本讓客戶接入DPU規(guī)?;渴鹋c業(yè)務驗證。鄢貴海強調,中科馭數(shù)做芯片,最終是為了服務云,以上三方面將構成算力基礎設施領域的“芯云計劃”。
第三代DPU芯片K2-Pro發(fā)布
發(fā)布會上,中科馭數(shù)第三代DPU芯片K2-Pro正式發(fā)布,是目前國內首顆量產全功能DPU算力芯片,專為未來數(shù)據中心和云原生環(huán)境定制優(yōu)化。
中科馭數(shù)高級副總裁、CTO盧文巖表示,DPU的量產落地是檢驗其技術創(chuàng)新的“驗金石”,整個研發(fā)團隊的重心也一直是量產和實用。面臨底層架構的復雜挑戰(zhàn),中科馭數(shù)從基礎理論出發(fā),用創(chuàng)新的體系結構理論指導復雜的芯片架構設計,主要基于自研KPU架構以及國內首個DPU指令集——KISA。
作為中科馭數(shù)上一代DPU芯片K2的量產版本,K2-Pro在功能、性能、穩(wěn)定性、靈活性、系統(tǒng)管理、能效性六大維度實現(xiàn)了對K2的升級。在數(shù)據處理方面,K2-Pro包處理速率翻倍至80Mpps,在網絡密集型應用中能提供更高的吞吐量和更低的延遲;強化復雜業(yè)務支持,集成網絡卸載、流表卸載、存儲卸載及RDMA網絡卸載等多類型硬件卸載引擎,實現(xiàn)用輕量控制面支撐復雜業(yè)務,復雜服務網格性能從400微秒降至30微秒以內,實現(xiàn)量級躍升;通過PPP、NP內核及P4可編程架構,實現(xiàn)業(yè)務與同構算力、異構算力靈活擴展,用戶可以根據實際需求動態(tài)調整和優(yōu)化系統(tǒng)配置,相當于讓算力得到自由延展;提供全面的片上與板級管理系統(tǒng),加強資源管理與穩(wěn)定性;并在DPU復雜場景下能耗降低30%,實現(xiàn)低功耗運行。
基于K2-Pro的架構優(yōu)勢和在功能方面的設計考量,中科馭數(shù)推出了三大系列的6款DPU卡產品:分別是面向超低時延網絡的“思威”SWIFT系列產品——SWIFT-2200N、SWIFT-NDPP,面向高吞吐無損網絡的“福來”FlexFlow系列——FLEXFLOW-2200T、FLEXFLOW-2100R,以及面向軟件定義網絡的“功夫”Conflux系列——CONFLUX-2200P、CONFLUX-2200E。目前,這六款產品已經上架中科馭數(shù)京東官方旗艦店,開啟預售。
HADOS 3.0 軟件已突破萬卡級別落地部署
如果說“性能”的關鍵是芯片,那么“好用和易用”的核心就是軟件。作為銜接硬件和上層應用的橋梁,DPU基礎軟件是決定硬件是否好用的基礎。在本次發(fā)布會上,中科馭數(shù)正式宣布自研軟件開發(fā)平臺HADOS已全新升級到3.0版本,是中科馭數(shù)在DPU基礎軟件生態(tài)建設上的重大突破。
據介紹,HADOS 3.0專為DPU優(yōu)化設計,核心代碼量已經超過 126 萬行,累計總代碼量近千萬行,擁有驅動、計算、存儲、網絡、安全等不同層次的API 數(shù)量高達2765個,并且擁有豐富的、開箱即用的模塊和功能。目前,HADOS已突破萬卡級別的落地部署,適配了8 款CPU平臺以及10大主流操作系統(tǒng)。在行業(yè)應用上,已有金融、電信、能源、科研、云數(shù)據中心等多個行業(yè)在內的數(shù)十家用戶部署使用HADOS平臺,如HADOS的超低時延協(xié)議棧結合中科馭數(shù)的DPU,已經在國內的證券交易等時延敏感場景批量落地使用。
中科馭數(shù)高級副總裁張宇表示,HADOS 3.0是一個里程碑式的版本,不僅是功能和代碼的迭代,更是對DPU應用場景深度理解后的全面革新,體現(xiàn)了全面擁抱“敏捷開發(fā)”的理念和方法,以及對高效、靈活、安全、易用的極致追求,助力解決 DPU 廣泛落地高性能云數(shù)據中心。
首次呈現(xiàn)中科馭數(shù)DPU全方位云計算實踐
云是算力供給的一種最普遍的形式,無論是通用計算、還是智算,因此,支撐云基礎設施,也是DPU的核心價值體現(xiàn)。中科馭數(shù)聯(lián)合行業(yè)內眾多合作伙伴共同打造的以數(shù)據網絡為核心的高性能云底座方案——馭云,也在本次發(fā)布會上正式亮相。
中科馭數(shù)應用研發(fā)部總經理陳巖介紹,馭云解決方案采用“IaaS on DPU”技術路線,依托于DPU的卸載能力,將云計算體系中的基礎設施層面完全下沉,為集群提供網絡轉發(fā)、存儲服務、安全防護、管理調度等能力,完成了整個云計算環(huán)境的構建與運轉,將服務器側的CPU與GPU算力全部預留給業(yè)務系統(tǒng)應用,為云計算提供高性能、高吞吐、高安全的算力底座。
目前,中科馭數(shù)在信創(chuàng)園搭建的馭云開放平臺,集成了超400臺高性能服務器,采用創(chuàng)新的3U一體架構,深度融合CPU、GPU與DPU技術。中科馭數(shù)產品運營部副總經理曹輝介紹,馭云開發(fā)平臺不僅為中科馭數(shù)自身的研發(fā)與數(shù)字化體系提供強大的算力支撐,還廣泛向客戶及生態(tài)伙伴敞開大門,提供DPU軟件開發(fā)平臺、科研教學及驗證服務、P4網絡編程平臺、聯(lián)合方案孵化服務、基于DPU的高性能異構基礎設施資源服務以及DPU云市場六大服務,旨在構筑一個開放、先進的云算力設計與驗證平臺,加速高性能計算應用的落地與推廣。
國產DPU走向何方?
從英偉達最新的產品路線圖來看,并未將DPU芯片單獨列出,而是將它包含在網絡平臺產品中進行了布局。雖然不能說弱化了DPU的定位,但對比前些年,英偉達剛剛收購以色列網絡芯片商Mellanox時,親手賦予了DPU“數(shù)據中心與CPU、GPU同為三大支柱”的光環(huán),如今,DPU在英偉達的全棧產品布局中確實越來越在退居“幕后”。這對國內獨立的第三方DPU企業(yè)有什么啟發(fā)?
對此,鄢貴海首先認為,英偉達目前基本是以完整的高算力節(jié)點作為產品形態(tài),注重以集群方式做布局,產品的演進方向與該公司的全局思考密不可分。
他認為,英偉達的技術進步確實給國內芯片企業(yè)提供了發(fā)展方向,尤其是在算力、精度配置和網絡速度方面。在這一背景下,國內DPU企業(yè)應該更加專注于核心競爭力,逐步提升技術水平和產業(yè)成熟度。同時,鄢貴海也指出國內芯片產業(yè)在工藝、設計和產業(yè)成熟度上與國際巨頭存在差距,還需要時間和專注來彌補,企業(yè)發(fā)展和行業(yè)競爭是一個長期且復雜的過程,需要耐心和持續(xù)的努力。
預計今年,K2-Pro將突破10K出貨量級。鄢貴海強調,這僅僅是開始,因為目標替代場景太多了,他并不擔心未來的市場容量,核心是要把DPU和現(xiàn)有業(yè)務集成好,能夠把流量無縫導入DPU設備中,迅速讓客戶能夠因為切換而獲益,市場自然會越做越全。
“如果非常要給一個數(shù)字,我覺得我們的DPU三年內應該可以突破百萬量級,在整個網絡市場占有率能夠達到30%”,鄢貴海信心滿滿地表示。