SemiAnalysis 分析 DeepSeek
https://semianalysis.com/2025/01/31/deepseek-debates/
SemiAnalysis 深入分析了 DeepSeek 在人工智慧產業中的迅速崛起,重點關注其與 High-Flyer 的策略性關係、GPU 投資,以及訓練模型的真實成本。
DeepSeek 與 High-Flyer
·
High-Flyer(中國對沖基金)早期認識 AI 的變革潛力,不僅限於金融領域。
- 2021 年投資
10,000 張 A100
GPU,預測 AI 需求增長。
- 2023 年 5 月成立 DeepSeek,深入 AI 研究。
- High-Flyer 與
DeepSeek 共享人力與計算資源,GPU 投資總額超過 5 億美元,即使面臨出口管制。
GPU 資源與投資
·
DeepSeek 擁有約 50,000 張 Hopper GPU(H800、H20),符合監管標準。
- 這些 GPU 用於交易、推理、訓練及研究。
- 總伺服器資本支出約 16 億美元,運營成本約 9.44 億美元。
訓練成本與效率
·
DeepSeek 公開聲稱模型訓練成本約 550 萬美元,但 SemiAnalysis 指出該數字誤導。
- 綜合評估顯示,實際訓練成本可能高達 16 億美元,包括基礎設施、硬體及運營費用。
市場影響
·
DeepSeek 的崛起引發 GPU 需求討論。
- 儘管部分觀點認為其效率將降低對 GPU 的需求,但 SemiAnalysis 指出,這反而提升了市場需求。
- H100 和 H200
GPU 價格因此受到影響。
總結
·
DeepSeek 的成功來自 High-Flyer 支持及巨額基礎設施投資。
- 其公開的低訓練成本數據值得商榷,實際成本可能遠高於官方聲稱。
- DeepSeek 的技術發展促使高性能 GPU 需求進一步增加,而非減少。
Comments
Post a Comment