智通財經APP獲悉,英偉達在AI芯片與PC芯片領域最強競爭對手AMD(AMD.US) 的數據中心業務部門業績未達到市場預期,意味着其在人工智能算力基礎設施市場上未能縮小與有着“AI芯片霸主”稱號的英偉達(NVDA.US) 的巨大市場份額差距。儘管AMD的整體營收超出市場預期,併為當前季度提供了穩健的業績預測,但對標英偉達數據中心業務(該業務部門涵蓋H100/H200以及Blackwell系列高性能AI
GPU的銷售額)的AMD數據中心業務部門被視為薄弱環節。財報發佈後,這家芯片巨頭的股價在美股盤後交易中一度下跌超過10%。
值得注意的是,在一些看漲AMD基本面與股價前景的華爾街分析師看來,DeepSeek所主導並引領的這股史無前例的“低成本AI算力風暴”,或將是推動AMD未來蠶食英偉達在AI芯片市場高達90%“壟斷性市場份額”的核心助燃劑。
這股低成本風暴不僅指的是DeepSeek引領的AI訓練與推理端成本大幅下降的新AI算力範式,還指代DeepSeek引領的“精細化的PTX優化浪潮”,打破英偉達最強護城河——“CUDA生態”的獨佔地位,DeepSeek的底層PTX優化技術提升了對AI基礎硬件性能的利用。通過這種方式,微軟與亞馬遜等雲巨頭可以更容易地在不同的硬件架構之間切換,PTX允許開發者進行更精細的控制,從而提供比傳統CUDA編程更精確的性能優化。
隨着開源AI大模型DeepSeek橫空出世且在極短時間內火爆全球,DeepSeek本身所掀起的“低成本AI大模型算力範式”,有望持續推動人工智能訓練與推理端成本大幅下行,以及PTX能夠針對特定的硬件體系進行專屬模式的優化,以“極高性價比”著稱的AMD
MI300X以及新推出的MI325X,以及後續MI350系列AI加速器產品,有望斬獲更龐大的AI芯片市場份額。
在華爾街,知名投資機構Rosenblatt Securities看漲AMD股價未來12個月內衝高至250美元,Loop
Capital與花旗集團均看漲至175美元。截至週二美股收盤,AMD股價收於119.500美元。
雖然展望樂觀,但AMD數據中心銷售額未達市場預期! 在PC市場的表現亮眼
具體的財報數據顯示,第四季度,AMD數據中心業務部門的營收規模約為38.6億美元,同比增長69%,但華爾街分析師此前的普遍預計約為40.9億美元。該芯片巨頭週二在業績展望部分表示,預計當前季度數據中心業務部門的營收將在68億至74億美元之間,分析師普遍預期約為70.4億美元,其預測區間的中值僅僅略高於分析師預期,相比於其AI芯片最強競爭對手英偉達過去兩年數據中心業務營收指數級增長而言,這還不足以讓投資者印象深刻。平均而言,分析師們預測該部門將在2025年創造184億美元營收,意味着有望相比於2024年增長約46%。
AMD首席執行官蘇姿豐(Lisa
Su)在業績會議上表示,與AI芯片相關的營收規模將在“未來幾年”達到“數百億美元”級別,並且還預計AMD的數據中心業務部門的營收增長將在2025年下半年將比上半年強勁得多,展望新產品線,蘇姿豐表示MI350系列產品的客户需求非常強勁,整體數據中心業務部門在今年有望實現“強勁的兩位數增長”。對此,有華爾街分析師表示,AMD已觀察到DeepSeek等低成本AI大模型帶來的更大規模算力需求,並且AMD的算力產品在AI芯片性價比方面遠強於英偉達。
AMD
管理層在與分析師的電話會議上對2025年全年業績展望持樂觀態度,稱其所有產品類別的需求都將大幅改善。首席執行官蘇姿豐在電話會議上表示,總體而言,該公司預計“整體營收和每股收益都將同比實現兩位數級別的強勁增長幅度”。
毫無疑問,Q4業績報告再次引發了對AMD在AI基礎設施領域推進勢頭減弱的擔憂情緒,證實了一些分析師和投資者的疑慮——即當前難以撼動英偉達在AI芯片領域的壟斷份額。
最近幾周,中國初創公司DeepSeek所推出的DeepSeek-R1大模型,以極低成本的方式進入AI大模型市場,雖然有分析師表示AMD未來AI芯片銷售額將受益於低成本AI算力範式,但AMD在短期內難以避免因訓練成本大幅下降帶來的“殺估值效應”,跟隨英偉達、博通以及阿斯麥等芯片巨頭股價暴跌。截至週二收盤,AMD股價今年已下跌1.1%,上週AMD股價的周跌幅巨大,主要因DeepSeek帶來的情緒面打擊而大跌近6%。
中國初創公司DeepSeek上個月表示,它能夠以遠低於OpenAI等美國AI科技領軍者的成本開發出具有競爭力的開元AI大模型。這一聲明引發了與AI相關股票,尤其是與AI密切相關的芯片股的劇烈拋售,主要包括AMD和英偉達,因為市場擔心,開發新硬件所需的鉅額預計支出將不再是必需的。
截至上週一美股收盤,由於投資者們擔憂DeepSeek引領的“低成本AI大模型算力範式”推動科技巨頭們在短中期內大幅削減AI
GPU訂單,因此“AI芯片霸主”英偉達(NVDA.US) 股價大跌近17%,收報118.42美元,單日的市值蒸發規模達到5890億美元,為美國股市歷史上最大規模市值損失,打破此前紀錄。
好消息則在於,AMD上季度在個人電腦和服務器CPU市場上從最強競爭對手英特爾(INTC.US) 手中奪得高於市場預期的基礎份額,但這一領域的增長動力因越來越多企業轉向GPU等AI加速器而不是CPU體系而愈發疲弱。在上季度,PC芯片業務為AMD帶來了高達23億美元的營收,超過了19.9億美元的華爾街分析師普遍預期。
AMD正試圖説服一些全球最大規模的雲計算公司在其數據中心擴展計劃中採用其AI芯片產品。在這項擴展努力中,AMD仍在竭盡全力追趕英偉達。儘管AMD現在每年從幫助開發人工智能大模型以及滿足推理端算力需求的AI芯片市場中獲得超過50億美元的營收,但其最強競爭對手英偉達在這一類別的營收每年超過1000億美元。
整體營收方面,AMD第四季度總營收增長約24%,達到76.6億美元,超過了75.4億美元的華爾街分析師普遍預期。扣除某些項目後的每股利潤為1.09美元,符合華爾街預期。
此外,AMD還為微軟(MSFT.US) 以及索尼集團(SONY.US) 的遊戲機提供定製處理器。由於當前一代遊戲主機接近其生命週期尾聲,該業務部門的銷售情況疲軟。第四季度,AMD遊戲業務部門營收大幅下降59%,至5.63億美元。
DeepSeek引領的“低成本AI算力風暴”,將助攻AMD徹底打破英偉達壟斷AI芯片市場的局面?
近期,來自中國DeepSeek的AI工程師團隊所開創的DeepSeek
R1大模型可謂霸榜美國熱搜,並且DeepSeek應用持續登頂蘋果中國地區和美國地區應用商店免費APP下載排行榜,在美區下載榜上超越ChatGPT。DeepSeek團隊證明,他們能夠在沒有世界最頂級的英偉達高性能AI
GPU提供強大AI算力的情況下,以極低成本加上性能普通的AI加速器訓練出推理能力一流的突破式開源AI大模型。
在不到600萬美元的極低投入成本和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比OpenAI
o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元,DeepSeek的推理輸入與輸出token定價相比於OpenAI定價則可謂“骨折級”促銷。
隨着這股來自東方的“DeepSeek低成本AI算力風暴”席捲全球,投資者們開始強烈質疑美國科技巨頭們對於人工智能堪稱“非理性”的狂熱AI燒錢計劃是否合理,畢竟動輒千億美元的支出,相比於DeepSeek僅僅百萬美元級別成本令這些美國科技股投資者無比震驚的同時也無比憤怒。
DeepSeek
的低成本+超高效+不輸於o1的大模型綜合性能,源於對大模型訓練流程的每個環節都施加了“極致工程”與“精細微調”,幅降低大模型訓練/推理成本。比如,以極致工程為導向的高效訓練與數據壓縮策略,通過多層注意力(MLA)——尤其對Query端進行低秩化,將連續的Key/Value矩陣進行合併和壓縮,大幅減少內存佔用,從而在訓練時減少激活內存負擔,還包括FP8
混合精度訓練、DualPipe 並行通信、專家門控(MoE)負載均衡等手段,讓 DeepSeek
在訓練階段將硬件資源利用率最大化,減少“不必要的算力浪費”,以及“強化學習(即RL)+蒸餾+專業數據優化”的創新型AI訓練舉措,無需依賴監督微調(SFT)或人工標註數據。
硬件端的算力優化乃AI領域核心聚焦點,DeepSeek通過對英偉達H800
GPU的PTX層級優化,超越了CUDA提供的標準編程接口,使得GPU的計算能力得到了最大化利用。這一方法顯著提高了硬件利用效率,大幅減少了計算和通信的瓶頸。通過減少GPU使用的時間和計算資源,DeepSeek能夠以更低的成本完成同樣的訓練任務。
總之,PTX允許開發者進行更精細的硬件資源控制,比如優化寄存器分配和線程調度,從而提供比傳統CUDA編程更精確的性能優化,還能在某些情況下繞過CUDA加速庫生態,提供對硬件的極致優化。這也意味着隨人工智能訓練與推理端的成本下行浪潮開啟,雲巨頭們未來將更容易轉向採購成本相比於英偉達Hopper與Blackwell低得多的AMD
AI加速器體系。
DeepSeek通過直接操作PTX,進行極限級的硬件優化,包括細粒度的線程/線程束調整和通信優化,這種基於PTX級別的優化允許DeepSeek在H800
GPU上實現更高效的AI算力資源使用。這也是為什麼在DeepSeek問世後,AMD第一時間宣佈將DeepSeek開源大模型集成到 Instinct MI300X
GPU 體系上。這一集成旨在與 SGLang 配合使用,以實現最佳性能。AMD還透露,SGLang與DeepSeek團隊通力合作,使 DeepSeek V3
FP8從首發當天就能在英偉達和AMD GPU體系上順利運行。
DeepSeek所引領的低成本AI算力範式,尤其是專注於PTX語言的算子優化,為雲廠們提供了更多的硬件選擇,並有可能促使這些雲廠轉向AMD、谷歌TPU,或者自研的AI
ASIC。DeepSeek的底層PTX優化技術提升了對硬件性能的利用,雲廠們可以更容易地在不同的硬件架構之間切換,尤其是當英偉達AI
GPU資源緊張或受到政府出口限制時。
蘇媽預測:數據中心部門今年將實現強勁增幅,下半年的情況將好於上半年
被AMD粉絲們親切稱為“蘇媽”的蘇姿豐在業績電話會議上對於2025年持樂觀態度,稱其所有產品類別的需求都將改善,並且預計AMD的數據中心業務部門的營收增長將在2025年下半年將比上半年強勁得多,數據中心業務部門在今年有望實現“強勁的兩位數增長”。
AMD重磅打造的 MI300X這一款AI加速器在內存帶寬和容量方面相比於英偉達Hopper架構AI
GPU具有強大優勢,尤其適用於對於AI並行化算力負載要求較高的生成式AI模型訓練和推理任務。甲骨文與AMD合作建設AI超算中心表明,AMD在硬件設計和AI相關的軟件生態支持上,特別是高性能計算和AI工作負載所需的軟硬件協同體系方面,已經具備強大的競爭力。
應用於數據中心AI服務器的AMD M300X
升級版本——MI325X於第四季度開始量產以及上市銷售,AMD更加先進的MI350系列則將在2025年推出,而MI400系列計劃在一年後推出。蘇姿豐表示,公司將在本季度向主要客户提供MI350系列樣品,並計劃在年中開始出貨,並且表示MI350系列產品的客户需求非常強勁。MI400系列按計劃將於2026年推出。
AMD全新推出的MI325X性能指標方面,基於台積電3nm製造工藝的MI325X將延續AMD強大的CDNA3構架,同時與英偉達H200一樣採用第四代HBM存儲系統——HBM3E,內存容量大幅提升至288GB,帶寬也將提升至6TB/s,整體的性能將進一步提升,其他方面的基準規格與兼容性則基本與MI300X一致,方便AMD客户升級過渡。MI325X
AI性能提升幅度為AMD史上最大幅度,相較競品英偉達H200將有1.3倍以上提升;AMD MI325X峯值理論FP16是H200的1.3倍左右,1.3
倍於H200的內存帶寬,基於每台服務器的模型大小是H200的2倍。
(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鐘。)新聞來源 (不包括新聞圖片): 智通財經