DeepSeek Ai Sorprese: lo sviluppo di miliardi di dollari svelato
Il modello AI sorprendentemente economico di Deepseek, Deepseek V3, ha scosso il mondo della tecnologia, causando un calo significativo del prezzo delle azioni di Nvidia. Mentre Deepseek inizialmente ha rivendicato un costo di formazione di soli 6 milioni di dollari, uno sguardo più attento rivela un investimento molto più sostanziale.
Immagine: Ensigame.com
L'architettura innovativa di Deepseek V3 è la chiave per le sue prestazioni. Sfrutta:
- Previsione multi-token (MTP): Previsione contemporaneamente più parole per una maggiore precisione e velocità.
- Miscela di esperti (MOE): Utilizzo di 256 reti neurali (otto attive per token) per l'addestramento accelerato e prestazioni migliorate.
- Attenzione latente multi-testa (MLA): Estrarre ripetutamente informazioni chiave dai frammenti di testo per ridurre al minimo la perdita di dettaglio cruciale.
Immagine: Ensigame.com
Tuttavia, la semianalisi ha rivelato la vera infrastruttura di DeepSeek: circa 50.000 GPU della tramoggia Nvidia (comprese le unità H800, H100 e H20) si sono diffuse su più data center. Ciò rappresenta un investimento totale di server di circa $ 1,6 miliardi, con costi operativi stimati in $ 944 milioni. Ciò contraddice il reclamo iniziale di $ 6 milioni, che ha coperto solo l'utilizzo della GPU pre-allenamento, escluso la ricerca, la raffinatezza, l'elaborazione dei dati e l'infrastruttura.
DeepSeek, una filiale di High-Flyer, un hedge fund cinese, possiede i suoi data center, a differenza dei concorrenti al centro del cloud. Questo approccio autofinanziato consente una rapida innovazione e implementazione. La società attira i migliori talenti cinesi, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno.
Immagine: Ensigame.com
L'effettivo investimento di Deepseek nello sviluppo dell'IA supera i $ 500 milioni. Mentre la sua struttura snella promuove l'efficienza, la narrazione del "bilancio rivoluzionario" è fuorviante. Il vero successo deriva da investimenti sostanziali, progressi tecnologici e un team altamente qualificato.
Immagine: Ensigame.com
Nonostante le richieste iniziali iniziali gonfiate, i costi di formazione del modello di DeepSeek ($ 5 milioni per R1) sono ancora significativamente inferiori rispetto ai concorrenti come Chatgpt4o ($ 100 milioni), evidenziando un vantaggio competitivo. L'esempio di DeepSeek mette in mostra un percorso per il successo per società di intelligenza artificiale ben finanziate e indipendenti, ma la realtà è molto più costosa di quanto inizialmente interpretata.






