Deepseek ai Strorciones: Desarrollo de mil millones de dólares presentado

Autor : Jason Feb 24,2025

El modelo de IA sorprendentemente económico de Deepseek, Deepseek V3, ha sacudido el mundo tecnológico, causando una caída significativa en el precio de las acciones de Nvidia. Si bien Deepseek inicialmente reclamó solo un mero costo de capacitación de $ 6 millones, una mirada más cercana revela una inversión mucho más sustancial.

DeepSeek TestImagen: Ensigame.com

La arquitectura innovadora de Deepseek V3 es clave para su rendimiento. Aprovecha:

  • Predicción múltiple (MTP): Predecir múltiples palabras simultáneamente para una mayor precisión y velocidad.
  • Mezcla de expertos (MOE): Utilizando 256 redes neuronales (ocho activos por token) para el entrenamiento acelerado y un mejor rendimiento.
  • Atención latente de múltiples cabezas (MLA): Extraiga repetidamente información clave de fragmentos de texto para minimizar la pérdida de detalle crucial.

DeepSeek V3Imagen: Ensigame.com

Sin embargo, el semianálisis reveló la verdadera infraestructura de Deepseek: aproximadamente 50,000 GPU de la tolva NVIDIA (incluidas las unidades H800, H100 y H20) se extienden en múltiples centros de datos. Esto representa una inversión de servidor total de aproximadamente $ 1.6 mil millones, con costos operativos estimados en $ 944 millones. Esto contradice el reclamo inicial de $ 6 millones, que solo cubrió el uso de la GPU previa al entrenamiento, excluyendo la investigación, el refinamiento, el procesamiento de datos e infraestructura.

Deepseek, una subsidiaria de High-Flyer, un fondo de cobertura chino, posee sus centros de datos, a diferencia de los competidores que dependen de la nube. Este enfoque autofinanciado permite una rápida innovación e implementación. La compañía atrae a los mejores talentos chinos, y algunos investigadores ganan más de $ 1.3 millones anuales.

DeepSeekImagen: Ensigame.com

La inversión real de Deepseek en el desarrollo de IA supera los $ 500 millones. Si bien su estructura magra fomenta la eficiencia, la narrativa del "presupuesto revolucionario" es engañosa. El verdadero éxito proviene de una inversión sustancial, avances tecnológicos y un equipo altamente calificado.

DeepSeekImagen: Ensigame.com

A pesar de los reclamos de costos iniciales inflados, los costos de capacitación modelo de Deepseek ($ 5 millones para R1) siguen siendo significativamente más bajos que los competidores como CHATGPT4O ($ 100 millones), destacando una ventaja competitiva. El ejemplo de Deepseek muestra un camino hacia el éxito para las compañías de IA independientes bien financiadas, pero la realidad es mucho más costosa de lo que inicialmente se retrata.