SemiAnalysis 分析 DeepSeek

 https://semianalysis.com/2025/01/31/deepseek-debates/


SemiAnalysis 深入分析了 DeepSeek 在人工智慧產業中的迅速崛起,重點關注其與 High-Flyer 的策略性關係、GPU 投資,以及訓練模型的真實成本。

DeepSeek High-Flyer

·        High-Flyer(中國對沖基金)早期認識 AI 的變革潛力,不僅限於金融領域。

  • 2021 年投資 10,000 A100 GPU,預測 AI 需求增長。
  • 2023 5 月成立 DeepSeek,深入 AI 研究。
  • High-Flyer DeepSeek 共享人力與計算資源,GPU 投資總額超過 5 億美元,即使面臨出口管制。

GPU 資源與投資

·        DeepSeek 擁有約 50,000 Hopper GPUH800H20),符合監管標準。

  • 這些 GPU 用於交易、推理、訓練及研究。
  • 總伺服器資本支出約 16 億美元,運營成本約 9.44 億美元。

訓練成本與效率

·        DeepSeek 公開聲稱模型訓練成本約 550 萬美元,但 SemiAnalysis 指出該數字誤導。

  • 綜合評估顯示,實際訓練成本可能高達 16 億美元,包括基礎設施、硬體及運營費用。

市場影響

·        DeepSeek 的崛起引發 GPU 需求討論。

  • 儘管部分觀點認為其效率將降低對 GPU 的需求,但 SemiAnalysis 指出,這反而提升了市場需求。
  • H100 H200 GPU 價格因此受到影響。

總結

·        DeepSeek 的成功來自 High-Flyer 支持及巨額基礎設施投資。

  • 其公開的低訓練成本數據值得商榷,實際成本可能遠高於官方聲稱。
  • DeepSeek 的技術發展促使高性能 GPU 需求進一步增加,而非減少。

Comments

Popular posts from this blog

AI Self-Replication (Resources)