作者:豐寧
曾經,GPU在AI領域炙手可熱,但步入2025年,它迅速遭遇了多重嚴峻考驗。
在過去半個月的時間里,GPU領域遭遇了兩大主要挑戰(zhàn)。首先,美國政府出臺了新的禁令措施,對GPU的發(fā)展構成了直接限制。其次,ASIC等定制芯片的迅速崛起,給GPU市場帶來了顯著的沖擊與競爭壓力。接下來,半導體產業(yè)縱橫將深入探討這兩大因素如何具體影響著GPU市場。
?01挑戰(zhàn)一:美國進一步收緊AI芯片出口
首先來看GPU面臨的第一個挑戰(zhàn)。
1月13日晚,拜登政府正式宣布加碼對AI芯片及相關關鍵技術的出口管制,限制中國等競爭對手獲取先進GPU的能力。根據已公布的信息,新規(guī)按照受管制程度高低,將世界各國和地區(qū)劃分為三大類別。
日本、英國、韓國和荷蘭、加拿大等18個美國親密盟友和合作伙伴得到豁免,可以自由采購先進AI芯片;新加坡、以色列、沙特阿拉伯、印度、巴西和波蘭等120多個國家和地區(qū),將被施加AI芯片出口的配額限制;中國、俄羅斯、伊朗和朝鮮等,則被完全禁止獲取高端AI芯片和先進的封閉權重模型(Closed-weight models)。
管制新規(guī)進一步明確,小批量訂單不受配額影響:如果芯片訂單的總算力未超過大約1700個先進GPU,那么就不需要獲取美國的許可,并且不會計入特定國家或地區(qū)進口芯片的限額,以使得來自大學、醫(yī)療機構和研究組織的AI芯片訂單可以繼續(xù)進行。另據美國商務部工業(yè)與安全局 (BIS) 官網披露,美國企業(yè)的海外數據中心建設亦將受到限制。
新規(guī)要求像亞馬遜、微軟、谷歌這樣的云服務提供商,必須在美國境內部署一半的受管制AI芯片;部署在美國親密盟友和合作伙伴之外的受管制芯片規(guī)模,則不得超過25%;而且,在美國親密盟友和合作伙伴以外的任何單一國家和地區(qū)部署的受管制芯片規(guī)模,不得超過7%。美國商務部長雷蒙多稱:“美國當前在AI開發(fā)和AI芯片設計領域處于世界領先地位,維持這種局面至關重要?!彼€稱,管制新規(guī)無意切斷世界與AI創(chuàng)新的聯(lián)系,而是專門限制海外最先進AI技術的發(fā)展。
這份AI出口管制新規(guī)設置了120天的意見征詢期,并且內容可以修改,意味著后續(xù)將由特朗普政府最終決定先進AI芯片的出口規(guī)則。眾所周知,美國已多輪出擊,對中國大陸獲取 GPU 芯片實施管制。這一做法,一方面拖累了中國大陸 AI 能力的發(fā)展進程,另一方面,也悄然改寫著 GPU 的市場格局。
受此影響,GPU 市場呈現兩大變化。GPU市場的兩大變化第一點,中國大陸本土 GPU 制造能力增強。近年來,中國國內的許多GPU企業(yè)開始嶄露頭角。通過持續(xù)的投入和努力,國產GPU在性能、功能和應用領域等方面都有了提升,逐漸贏得了市場的認可和用戶的信任。國產GPU不僅在傳統(tǒng)圖形處理領域取得了進展,也能夠在人工智能、高性能計算等新興領域展現出一定的競爭力。主要廠商包括景嘉微、寒武紀、海光信息、天數智芯等。
雖然國產GPU芯片在技術上取得了顯著進步,但與國際巨頭如英偉達相比,仍存在性能差距。未來隨著計算需求的不斷增長和算法的不斷優(yōu)化,國產GPU芯片需要不斷提升其性能以滿足更廣泛的應用場景。通過加大研發(fā)投入,引入更先進的制造工藝和設計理念,國產GPU芯片有望在未來實現技術突破。
第二點,英偉達等 GPU 行業(yè)龍頭的出貨能力受到拖累。早在2022年10月、2023年10月,美國商務部工業(yè)和安全局(BIS)兩次更新對中國的先進半導體和計算設備的出口管制,英偉達中國特供版GPU產品A800、H800芯片均已受到管制。
與此同時,AMD發(fā)布的性能最強的MI300X、MI300A、MI250X、MI250等多款 AI 芯片也不再能出口到中國了。美國的出口管制政策使得英偉達無法向中國市場提供最先進、性能最強的 GPU 產品,這限制了其在華業(yè)務的拓展,特別是在人工智能、云計算等對高性能 GPU 需求旺盛的領域。
中國作為全球最大的半導體市場之一,失去了這部分市場份額,對英偉達的營收增長帶來了一定壓力。盡管英偉達之后試圖通過推出一些替代產品來維持在中國市場的份額,如 HGX H20 GPU,但整體出貨能力仍受到較大影響。同時,這也可能引發(fā)全球 GPU 市場格局的調整,其他國際競爭對手可能會趁機搶占英偉達和 AMD 在中國市場留下的空白,進一步加劇全球 GPU 市場的競爭態(tài)勢。
AI芯片出口管制新規(guī)的發(fā)布也引發(fā)了英偉達的批評。英偉達政府事務副總裁Ned Finkle在1月13日一篇博文中指出,基于美國的技術,AI得以在世界各地廣泛應用,推動了國內外各行各業(yè)的進步與發(fā)展。但拜登政府試圖推行的“人工智能擴散”(AI Diffusion)規(guī)則,是前所未有和具有誤導性的,這可能會破壞全球創(chuàng)新和經濟增長。Ned Finkle批評稱,管制新規(guī)不會緩解任何威脅,只會削弱美國的全球競爭力,動搖那種使美國保持領先的創(chuàng)新能力。
?02挑戰(zhàn)二:定制芯片ASIC的興起,沖擊GPU
年初,一股ASIC熱席卷全球。ASIC熱潮興起的原因主要有三點:其一,GPU已成為AI芯片領域競爭的核心焦點。目前,英偉達所產出的GPU主要被各大科技巨頭所壟斷。第二點,GPU價格的飆升使得這些科技巨頭在采購芯片時需要支付更高的成本。第三點,從另一角度來看,即便科技巨頭暫且將成本因素置于次要地位,英偉達本身的供應不足狀況仍使這些科技巨頭憂心不已。
彼時尋找價格更為親民、供應更具穩(wěn)定性且能滿足自身 AI 運算需求的芯片,成為了眾多科技巨頭的當務之急,而 ASIC 芯片的出現,恰到好處地契合了這些需求。ASIC 熱潮突如其來,追根溯源,去年 12 月是關鍵轉折點。彼時,作為 ASIC 領域極為重要的概念股,博通的股價強勢上揚,從 180 美元一路飆升至 250 美元,市值一舉突破萬億美元大關。與之形成鮮明對比的是,英偉達風光不再,股價一路下行,甚至跌破 130 美元。
Google 公司大名鼎鼎的TPU(Tensor Processing Unit,張量處理單元),還有前幾年很火的比特幣礦機,英特爾的 Gaudi 2 ASIC 芯片,IBM 的 AIU,AWS 的 Trainium,都屬于 ASIC 芯片。此外,這幾年非?;鸬?DPU(Data Processing Unit,數據處理單元)和 NPU(Neural Processing Unit,神經網絡處理單元),也是 ASIC 芯片。
倘若一定要知道兩者各自有哪些優(yōu)勢,本文將在這里將ASIC與GPU做一個詳細對比。ASIC 專為特定 AI 算法定制,在執(zhí)行特定任務時性能卓越,像 Google 的 TPU 針對深度學習矩陣運算優(yōu)化,計算效率極高。它能效比出色,能降低能耗成本,且大規(guī)模處理數據時吞吐量高、延遲低。大規(guī)模使用時,其單位算力成本遠低于 GPU,如谷歌的 TPUv5、亞馬遜的 Trainium2 單位算力成本僅為英偉達 H100 的 70% 和 60%。不過,ASIC 靈活性差,功能固定,算法改變就需重新設計,開發(fā)難度大,軟件生態(tài)單一。
GPU 通用性強,能應對多種計算任務,在科學計算、游戲渲染等領域廣泛應用。其并行計算能力強大,適合處理復雜神經網絡模型。而且,它擁有成熟豐富的軟件生態(tài),借助 CUDA 等,開發(fā)者易于上手。然而,GPU 在特定任務上效率遜于 ASIC,功耗較高,會增加能耗成本。高端 GPU 價格高昂,如英偉達 H100 售價 2.5 萬至 3 萬美元,獲取難度大,且存在時延較高的問題。
?03、GPU,會迎來淘汰嗎?
那么有了ASIC,會很快就淘汰GPU嗎?筆者認為,非也。綜合多家第三方機構的統(tǒng)計可見,在GPU市場,英偉達目前占據了大約90%份額,AMD雖然也在積極發(fā)布GPU產品,但因為在軟件生態(tài)建設方面不夠完善,到目前為止僅個位數百分比市場份額。
憑借性能、生態(tài)、集成能力等方面的優(yōu)勢,英偉達的 GPU 仍然會是中短期內的 AI 芯片首選。英偉達的軟硬件網絡整套方案都很成熟,技術和資金實力太強,GPU 的存量和出貨量依然很大,市場地位難以撼動。ASIC 的崛起速度雖然很快,但仍需要一定的時間走向成熟。AI ASIC 芯片的研發(fā),也具有很高的風險。即使研發(fā)成功,也需要時間被用戶所接受。
這就意味著,在很長的一段時間內,GPU 和 ASIC 都將處于共存狀態(tài)。基于不同的場景,用戶會選擇最適合自己的芯片。發(fā)展自研 ASIC,更多是有利于廠商們和英偉達進行談判砍價。AMD首席執(zhí)行官蘇姿豐也曾對這一問題發(fā)表過觀點,蘇姿豐表示:“目前,GPU是大語言模型的首選架構,因為GPU在并行處理方面非常高效,但在可編程性方面有所欠缺。五年多后它還會是首選架構嗎?我認為情況會發(fā)生變化?!碧K姿豐預計,五年或七年時間內GPU還不會失勢,但會出現GPU以外的新勢力。如此來看ASIC或許會是最優(yōu)選之一。
在未來一段時間內,ASIC芯片將處于快速發(fā)展階段,摩根士丹利預計,AI ASIC市場規(guī)模將從2024年的120億美元增長至2027年的300億美元,年復合增長率達到34%。當然,除了 ASIC 之外,像 FPGA 等其他類型的 AI 芯片也可能嶄露頭角,共同改變未來 AI 芯片的市場格局。GPU 雖然當前在 AI 領域占據重要地位,但隨著技術的不斷革新,其面臨的挑戰(zhàn)日益嚴峻,未來的 AI 芯片架構領域將充滿更多變數與可能性。