成人免费无码不卡毛片,亚洲AⅤ无码精品一区二区三区,国产尤物精品视频,久久精品日本亚洲,欧美成人一区三区无码乱码A片,中文字日产幕码一区二区色哟哟,亞洲日韓中文字幕網AV

  • 正文
    • 關于“邃思2.0”
    • 關于“云燧T20”訓練加速卡和“云燧T21”訓練OAM模組
    • 關于“馭算TopsRider”軟件平臺以及“云燧集群”
    • 寫在最后
  • 相關推薦
申請入駐 產(chǎn)業(yè)圖譜

國內(nèi)首發(fā)第二代訓練芯片,“邃思2.0”單精度張量TF32突破160T FLOPS

原創(chuàng)
2021/07/08
692
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

近日,燧原科技發(fā)布了第二代人工智能訓練產(chǎn)品——“邃思2.0”芯片,和邃思2.0一同發(fā)布的還有基于邃思2.0的“云燧T20”訓練加速卡和“云燧T21”訓練OAM模組,全面升級的“馭算TopsRider”軟件平臺以及全新的“云燧集群”。

關于“邃思2.0”

作為國內(nèi)首發(fā)的第二代人工智能訓練產(chǎn)品,邃思2.0采用Global Foundries的12nm FinFET工藝,挑戰(zhàn)日月光2.5D封裝的極限,將9顆芯片封裝在了57.5mm x 57.5mm的尺寸中。

?
圖 | 邃思2.0

計算精度方面,涵蓋FP32、TF32、FP16、BF16和INT8全AI算力空間,是中國首款支持單精度張量TF32數(shù)據(jù)精度的人工智能芯片。單精度FP32峰值算力達到40T FLOPS,單精度張量TF32峰值算力達到160T FLOPS,半精度BF16/ FP16峰值算力達到160T FLOPS,整數(shù)精度INT8峰值算力達到320 T FLOPS。

存儲帶寬方面,邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64 GB內(nèi)存,帶寬達1.8 TB/s,是中國第一個支持世界最先進存儲HBM2E和單芯片64 GB內(nèi)存的產(chǎn)品。

互聯(lián)能力方面,邃思2.0擁有6個LARE卡間互聯(lián)端口(燧原自研人工智能訓練集群互聯(lián)技術),每個端口可提供雙向50 GB/s的互聯(lián)帶寬,因此總集群互聯(lián)帶寬可達雙向300 GB/s,可支持數(shù)千張云燧CloudBlazer加速卡互聯(lián)。

關于“云燧T20”訓練加速卡和“云燧T21”訓練OAM模組

云燧T20和云燧T21是基于邃思2.0開發(fā)的全高全長PCIE板卡和OAM標準模組,均支持容量為64GB/32GB的HBM2E存儲,互聯(lián)帶寬同為300GB/s,但T21的板級功耗是400W,而T20的板級功耗為300W,因此在性能方面T21強于T20。

?
圖 | 云燧T21/T20

具體來講,T21的峰值算力是單精度張量TF32 160T FLOPS、單精度FP32 40T FLOPS,半精度BF16/ FP16 160T FLOPS,整數(shù)精度INT8 320 T FLOPS;T20的峰值算力是單精度張量TF32 134.4T FLOPS、單精度FP32 33.6T FLOPS,半精度BF16/ FP16 134.4T FLOPS,整數(shù)精度INT8 268.8 T FLOPS。

作為國內(nèi)首發(fā)產(chǎn)品,如何才能有說服力,當然是測試數(shù)據(jù),燧原也做了充足的基準測試Benchmarking,并在會上公布了云燧T20和友商次旗艦和旗艦產(chǎn)品的對比數(shù)據(jù)。

?
圖 | 云燧T20-Benchmark VS 友商次旗艦

?
圖 | 云燧T20-Benchmark VS 友商旗艦

關于“馭算TopsRider”軟件平臺以及“云燧集群”

基于云燧T20和T21訓練產(chǎn)品、GCU-LARE互聯(lián)技術和新一代馭算TopsRider軟件平臺,燧原科技可以打造超大規(guī)模的集群產(chǎn)品CloudBlazer Matrix 2.0。

?
圖 | 云燧智算集群CloudBlazer Matrix 2.0

對比第一代集群產(chǎn)品CloudBlazer Matrix 1.0的全高全長PCIE板卡,其采用OAM標準模組的2.0產(chǎn)品在性能上可謂突飛猛進。散熱形態(tài)從原來的液冷/風冷,全部改為液冷,最高支持板卡數(shù)量從1280張增加到8192張,單精度最高算力從原來的28P增長到1300P(1.3E),最高存儲容量(HBM)從原來的20TB增加到524TB,最大總存儲帶寬(HBM)從原來的0.65 PB/s增長到14.7 PB/s,最大互聯(lián)帶寬(LARE)從原來的0.25 PB/s增長到2.5 PB/s,與此同時,評價數(shù)據(jù)中心能源效率的指標卻從1.5降至了1.15。

寫在最后

燧原科技是一家2018年成立的公司,成立至今3年多時間,期間獲得過5輪融資,累計融資額近32億元人民幣。最新一筆融資記錄為今年1月完成的18億人民幣C輪融資,由中信產(chǎn)業(yè)基金、中金資本旗下基金、春華資本領投。

受資本熱捧的本質(zhì)是“燧原科技按計劃輸出產(chǎn)品,說到做到的誠信和能力”,根據(jù)燧原科技創(chuàng)始人、COO張亞林公布的燧原五年產(chǎn)品路線圖,到2023年,燧原科技將推出第三代產(chǎn)品——云端訓練計算產(chǎn)品T30/T31和智算集群CloudBlazer Matrix 3.0、云端推理計算產(chǎn)品i30,以及云端推理計算軟件平臺馭算Topsrider 3.X,實現(xiàn)泛AI生態(tài)。

值得一提的是,發(fā)布會上,張亞林發(fā)布了“燧原產(chǎn)品定理”,即燧原的每一代產(chǎn)品必須比前一代在“平均業(yè)務”中每瓦性能提升超3倍,軟件后向兼容可靠。
?

燧原科技

燧原科技

燧原科技專注人工智能領域云端算力平臺,致力為人工智能產(chǎn)業(yè)發(fā)展提供普惠的基礎設施解決方案,堅持原始創(chuàng)新的技術研發(fā)路線,提供高算力、高能效比的通用人工智能訓練和推理產(chǎn)品。其創(chuàng)新性架構、互聯(lián)方案和分布式計算及編程平臺,可廣泛應用于云數(shù)據(jù)中心、超算中心、泛互聯(lián)網(wǎng)、傳統(tǒng)行業(yè)及智慧城市等多個人工智能場景。

燧原科技專注人工智能領域云端算力平臺,致力為人工智能產(chǎn)業(yè)發(fā)展提供普惠的基礎設施解決方案,堅持原始創(chuàng)新的技術研發(fā)路線,提供高算力、高能效比的通用人工智能訓練和推理產(chǎn)品。其創(chuàng)新性架構、互聯(lián)方案和分布式計算及編程平臺,可廣泛應用于云數(shù)據(jù)中心、超算中心、泛互聯(lián)網(wǎng)、傳統(tǒng)行業(yè)及智慧城市等多個人工智能場景。收起

查看更多

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄
峨眉山市| 威海市| 庆阳市| 嫩江县| 西乡县| 太原市| 城固县| 德安县| 望奎县| 永修县| 巩义市| 孙吴县| 奎屯市| 光泽县| 新郑市| 乌拉特中旗| 桃源县| 商洛市| 基隆市| 明溪县| 桂东县| 永登县| 泸溪县| 周宁县| 东辽县| 息烽县| 磴口县| 济源市| 全南县| 麻江县| 阿拉尔市| 宁陕县| 磴口县| 航空| 华安县| 奇台县| 永宁县| 长海县| 仙居县| 衡阳市| 台北市|