Deepseek AI Kejutan: Pembangunan Billion-Dolar Diumumkan

Pengarang : Jason Feb 24,2025

Model AI yang sangat murah, DeepSeek V3, telah mengguncang dunia teknologi, menyebabkan penurunan harga saham Nvidia yang ketara. Walaupun Deepseek pada mulanya mendakwa kos latihan hanya $ 6 juta, penampilan yang lebih dekat mendedahkan pelaburan yang jauh lebih besar.

DeepSeek Testimej: ensigame.com

Senibina inovatif DeepSeek V3 adalah kunci kepada prestasinya. Ia memanfaatkan:

  • Ramalan Multi-Token (MTP): Meramalkan pelbagai perkataan secara serentak untuk peningkatan ketepatan dan kelajuan.
  • Campuran Pakar (MOE): Menggunakan 256 Neural Networks (lapan aktif per token) untuk latihan dipercepatkan dan prestasi yang lebih baik.
  • Perhatian Laten Multi-Head (MLA): Berulang kali mengekstrak maklumat utama dari serpihan teks untuk meminimumkan kehilangan terperinci penting.

DeepSeek V3imej: ensigame.com

Walau bagaimanapun, semianalisis mendedahkan infrastruktur sebenar DeepSeek: kira -kira 50,000 NVIDIA Hopper GPU (termasuk unit H800, H100, dan H20) tersebar di pelbagai pusat data. Ini mewakili jumlah pelaburan pelayan kira -kira $ 1.6 bilion, dengan kos operasi dianggarkan $ 944 juta. Ini bertentangan dengan tuntutan awal $ 6 juta, yang hanya meliputi penggunaan GPU pra-latihan, tidak termasuk penyelidikan, penghalusan, pemprosesan data, dan infrastruktur.

DeepSeek, anak syarikat High-Flyer, dana lindung nilai Cina, memiliki pusat datanya, tidak seperti pesaing yang berasal dari awan. Pendekatan yang dibiayai sendiri ini membolehkan inovasi dan pelaksanaan pesat. Syarikat itu menarik bakat China, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setahun.

DeepSeekimej: ensigame.com

Pelaburan sebenar DeepSeek dalam pembangunan AI melebihi $ 500 juta. Walaupun struktur kurus memupuk kecekapan, naratif "bajet revolusioner" adalah mengelirukan. Kejayaan sebenar berpunca daripada pelaburan yang besar, kemajuan teknologi, dan pasukan yang sangat mahir.

DeepSeekimej: ensigame.com

Walaupun tuntutan kos awal yang melambung, kos latihan model DeepSeek ($ 5 juta untuk R1) masih jauh lebih rendah daripada pesaing seperti ChatGPT4O ($ 100 juta), menonjolkan kelebihan daya saing. Contoh DeepSeek mempamerkan jalan menuju kejayaan untuk syarikat AI yang dibiayai dengan baik, tetapi realiti jauh lebih mahal daripada yang digambarkan pada awalnya.