Deepseek AIの驚き:10億ドルの開発が発表されました
Deepseekの驚くほど安価なAIモデルであるDeepseek V3は、テクノロジーの世界を揺さぶり、Nvidiaの株価が大幅に低下しました。 Deepseekは当初、わずか600万ドルのトレーニングコストを主張していましたが、よく見ると、はるかに大きな投資が明らかになりました。
画像:Ensigame.com
Deepseek V3の革新的なアーキテクチャは、そのパフォーマンスの鍵です。レバレッジ:
- マルチトークン予測(MTP):精度と速度の向上のために複数の単語を同時に予測します。
- 専門家の混合(MOE): 256のニューラルネットワーク(トークンごとに8つのアクティブ)を利用して、トレーニングを加速し、パフォーマンスを改善します。
- マルチヘッドの潜在的注意(MLA):重要な詳細損失を最小限に抑えるために、テキストフラグメントから重要な情報を繰り返し抽出します。
画像:Ensigame.com
しかし、Semianalysisは、Deepseekの真のインフラストラクチャである、約50,000のNvidia Hopper GPU(H800、H100、およびH20ユニットを含む)が複数のデータセンターに広がることを明らかにしました。これは、サーバーの総投資額を約16億ドルで、運用コストは9億4,400万ドルと推定されています。これは、研究、洗練、データ処理、インフラストラクチャを除く、トレーニング前のGPU使用のみをカバーする最初の600万ドルの請求と矛盾しています。
中国のヘッジファンドであるHigh-Flyerの子会社であるDeepseekは、クラウドに依存している競合他社とは異なり、データセンターを所有しています。この自己資金によるアプローチにより、迅速な革新と実装が可能になります。同社は中国のトップの才能を引き付け、一部の研究者は年間130万ドル以上を稼いでいます。
画像:Ensigame.com
DeepseekのAI開発への実際の投資は5億ドルを超えています。その無駄のない構造は効率を促進しますが、「革新的な予算」の物語は誤解を招くものです。真の成功は、実質的な投資、技術の進歩、高度なスキルのあるチームに由来しています。
画像:Ensigame.com
初期コストの請求が膨らんだにもかかわらず、DeepSeekのモデルトレーニングコスト(R1の500万ドル)は、ChatGPT4O(1億ドル)のような競合他社よりも依然として大幅に低く、競争上の優位性を強調しています。 Deepseekの例は、資金提供された独立したAI企業の成功への道を示していますが、現実は最初に描かれたよりもはるかに高価です。







