成人免费无码不卡毛片,亚洲AⅤ无码精品一区二区三区,国产尤物精品视频,久久精品日本亚洲,欧美成人一区三区无码乱码A片,中文字日产幕码一区二区色哟哟,亞洲日韓中文字幕網AV

  • 正文
    • 昇騰全面深度開放,底層創(chuàng)新促進AI模型發(fā)展
    • 昇騰持續(xù)引領創(chuàng)新,超節(jié)點+大EP護航MoE落地
    • 業(yè)界主流生態(tài)支持昇騰,加速共建AI產(chǎn)業(yè)大生態(tài)
  • 相關推薦
申請入駐 產(chǎn)業(yè)圖譜

開放創(chuàng)新托舉產(chǎn)業(yè)生態(tài),昇騰AI持續(xù)升騰

05/30 09:45
243
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

當前,智能算力革命重塑產(chǎn)業(yè)創(chuàng)新范式,人工智能進入“指數(shù)級躍遷”時代,模型迭代速度也迎來“指數(shù)級加速”。無論是擴展模型規(guī)模、提升泛化能力的“參數(shù)摸高”,還是優(yōu)化模型架構、提升運行效率的“工程創(chuàng)新”,都在沿著各自路徑快速推進,共同推動大模型敏捷迭代和規(guī)模應用。

在剛剛落幕的鯤鵬昇騰開發(fā)者大會2025——昇騰AI開發(fā)者峰會2025,一系列圍繞大模型創(chuàng)新的重大發(fā)布和開放舉措,也深刻印證了這一點。從底層開放促進AI創(chuàng)新,到超節(jié)點+大EP護航MoE落地,再到生態(tài)協(xié)同加速共建AI產(chǎn)業(yè),昇騰AI正持續(xù)升騰,“?!彼苁澜纭?/p>

昇騰全面深度開放,底層創(chuàng)新促進AI模型發(fā)展

隨著大模型的快速迭代,開發(fā)者的開發(fā)方式也在發(fā)生變化,逐漸從上層軟件走向更貼近硬件的極致優(yōu)化,對算力系統(tǒng)的開放性、工具鏈的豐富度等提出了新的要求。為此昇騰分層開源開放基礎硬件、異構計算架構CANN、昇思AI框架、以及各類應用使能套件和開發(fā)工具鏈,并持續(xù)升級發(fā)布新品賦能伙伴創(chuàng)新,通過底層創(chuàng)新促進AI模型發(fā)展。

在硬件使能層,CANN通過分層開放,當前已開源Ascend C、算子加速庫、集合通信庫等組件,并在Gitee上提供了260+算子、10+通信算法參考樣例,顯著提升開發(fā)效率;同時深度開放了Runtime運行時、畢昇編譯器等組件接口,滿足極致開發(fā)的需求。此外,CANN還在計算、通信、內(nèi)存三個維度持續(xù)提升,實現(xiàn)底層硬件資源的極致利用,精準適配不同開發(fā)場景需求,加速AI技術引領。

在算子開發(fā)層,昇騰在去年發(fā)布的Ascend C 2.0基礎上正式發(fā)布CATLASS昇騰算子模板庫,按照計算粒度自上而下分層設計,提供從接口調(diào)用到單條指令的多層可復用模板,當前已在Gitee社區(qū)開源上線并提供20個典型算子樣例,大幅縮短開發(fā)周期,實現(xiàn)算子性能最優(yōu)。

同時,畢昇編譯器全面升級,提供端到端的昇騰算子編譯和調(diào)優(yōu)能力,包括前端支持混合編程、異構編譯;中端借助親和微架構技術,使算子性能提升超 20%;后端能優(yōu)化寄存器分配、定位內(nèi)存異常;同時開放AscendNPU IR接口,實現(xiàn)無感對接Triton、FlagTree等Python算子編程框架,使能開發(fā)者在算子層面持續(xù)創(chuàng)新突破。

面向強化學習,昇騰發(fā)布強化學習開發(fā)套件MindSpeed RL并在Gitee上開源,提供大規(guī)模訓推共卡、權重Reshard和調(diào)度優(yōu)化等多場景加速技術,性能持續(xù)引領,滿足后訓練中多任務的協(xié)同加速。同時帶來多模態(tài)理解SDK和昇騰推理微服務MIS,大幅簡化應用的部署流程,更好地讓每位開發(fā)者聚焦應用的創(chuàng)新。

昇騰持續(xù)引領創(chuàng)新,超節(jié)點+大EP護航MoE落地

在模型快速迭代中,繼DeepSeek公布MoE模型訓推方案后,MoE(混合專家模型)憑借優(yōu)異模型效果已成為主流模型結構。隨之而來的是,MoE涉及最復雜的混合并行策略,隨著并行規(guī)模的增長,傳統(tǒng)服務器的跨機帶寬成為訓練核心瓶頸;同時MoE涉及多專家協(xié)作,專家負載不均的情況時常發(fā)生,導致效率低下且推理服務不穩(wěn)定。昇騰在這兩個維度創(chuàng)新引領,以超節(jié)點+大EP構筑了MoE落地的最佳拍檔。

在訓練方面,昇騰超節(jié)點架構親和MoE,以突破性架構創(chuàng)新打破集群互聯(lián)瓶頸,實現(xiàn)節(jié)點間高效協(xié)同,讓龐大集群如同一臺強大的計算機運行,大幅提升整體計算效率。峰會期間重磅推出的昇騰384超節(jié)點,通過構建業(yè)界最大規(guī)模的384卡高速總線互聯(lián)體系,將通信帶寬提升了15倍,訓練性能相比傳統(tǒng)節(jié)點實現(xiàn)了3倍飛躍,以強勁算力支撐大規(guī)模AI任務快速推進,使讓昇騰成為MoE模型的最佳選擇。

性能測試數(shù)據(jù)顯示,在昇騰384超節(jié)點上,LLaMA 3等千億稠密模型性能相比傳統(tǒng)集群提升2.5倍以上;在通信需求更高的Qwen、DeepSeek等多模態(tài)、MoE模型上,性能提升可達3倍以上,較業(yè)界其他集群高出1.2倍,在行業(yè)中處于領先地位。未來還可進一步擴展為包含數(shù)萬卡的超節(jié)點集群,為更大規(guī)模的模型演進提供有力支撐。

在推理環(huán)節(jié),昇騰大EP把模型權重分布到更多的卡上,通過降低單卡內(nèi)存權重占用,釋放更多內(nèi)存用于用戶并發(fā)所需的KV Cache,最終實現(xiàn)更大的單卡吞吐能力;同時,將每張卡專家數(shù)減少,使得權重加載時間更短,讓模型Decode更快,系統(tǒng)時延更低,最終實現(xiàn)了2到4倍的單卡吞吐提升,50%的系統(tǒng)時延降低,在相同卡數(shù)下獲得更大的收益,實現(xiàn)“一份投入,多份輸出”,并且用戶體驗更佳。

峰會期間,昇騰推理解決方案持續(xù)升級,全新發(fā)布MindIE Motor推理服務加速庫,提供精細異步調(diào)度、AutoPD分離、高階RAS等特性,通過動態(tài)專家冗余與親和調(diào)度技術均衡負載,AutoPD分離部署智能調(diào)配Prefill/Decode資源,三重RAS防護保障系統(tǒng)長穩(wěn)運行,進一步系統(tǒng)性提升昇騰大EP的能力。

在昇騰大EP的加持下,昇騰384超節(jié)點成為業(yè)界唯一實現(xiàn)一卡一專家的方案。該方案通過全高速總線互聯(lián)實現(xiàn)專家一卡一域分布,突破性達成Decode時延15ms的極致性能,在同等50ms時延下單卡吞吐達傳統(tǒng)集群4倍,賦能AI模型在實際應用中降本提質(zhì)增效,更好地保護客戶投資。

業(yè)界主流生態(tài)支持昇騰,加速共建AI產(chǎn)業(yè)大生態(tài)

在昇騰AI持續(xù)開放創(chuàng)新背后,業(yè)界主流社區(qū)支持昇騰、主流模型基于昇騰孵化……技術突破與生態(tài)發(fā)展得到同頻共振,一個基于昇騰的更加繁榮的AI產(chǎn)業(yè)大生態(tài)正加速構建。

一方面,Pytorch、vLLM等業(yè)界主流社區(qū)均已支持昇騰,便于開發(fā)者基于昇騰開發(fā)。會上,清華大學博士生、vLLM社區(qū)Maintainer游凱超分享了雙方的合作故事。在最新版本的vLLM中,開發(fā)者可以基于昇騰與vLLM的全鏈功能,一條命令實現(xiàn)底層應用的無感切換,同時通過插件化的解決方案獲得混合并行、動態(tài)調(diào)度等更多高階特性。未來雙方還將深化技術創(chuàng)新,為廣大用戶和開發(fā)者提供更極致的大模型推理體驗。

另一方面,基于昇騰AI基礎軟硬件平臺,各行各業(yè)已孵化50多個主流大模型。會上,科大訊飛星火大模型訓練工程資深技術專家張??》窒砹嘶跁N騰超節(jié)點架構的MoE模型訓練實踐。過去一年,訊飛完成了長思考強化學習、MoE訓練推理等多個關鍵技術在昇騰算力底座上的突破和率先應用;未來將攜手昇騰和廣大開發(fā)者,繼續(xù)全力推進星火大模型研發(fā)迭代,通過算法與算力的協(xié)同創(chuàng)新優(yōu)化,加速行業(yè)應用落地。

毫無疑問,業(yè)界主流生態(tài)對昇騰的支持,有助于整合各方資源,吸引更多開發(fā)者基于昇騰平臺進行開發(fā)。這不僅豐富了昇騰生態(tài)中的模型和應用種類,還能促進不同技術之間的交流與融合,加速AI技術的創(chuàng)新和推廣,推動全球AI生態(tài)系統(tǒng)的繁榮發(fā)展。

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

科技使能新商業(yè)——極客網(wǎng)創(chuàng)辦于2012年,尊崇“科學技術是第一生產(chǎn)力”,匯聚500位科技及垂直行業(yè)創(chuàng)作者,以深度評論和精選資訊聯(lián)接科技商業(yè)創(chuàng)新者、觀察者和讀者,為30萬+公號讀者呈現(xiàn)科技創(chuàng)新在新商業(yè)變革中的角色和能量。

马龙县| 余庆县| 益阳市| 枝江市| 马鞍山市| 任丘市| 墨脱县| 东源县| 海原县| 龙南县| 手游| 奉节县| 独山县| 平度市| 阿尔山市| 额尔古纳市| 包头市| 武穴市| 聂荣县| 江门市| 民权县| 延庆县| 金寨县| 旅游| 万荣县| 灵丘县| 五莲县| 丰顺县| 惠州市| 湖州市| 青龙| 静乐县| 常熟市| 孟村| 古浪县| 洛隆县| 桐城市| 清水县| 宁强县| 闽清县| 津市市|