Deepseek AI Surpreenda: Desenvolvimento de bilhões de dólares revelado

Autor : Jason Feb 24,2025

O modelo de IA surpreendentemente barato de Deepseek, Deepseek V3, abalou o mundo da tecnologia, causando uma queda significativa no preço das ações da Nvidia. Embora a Deepseek tenha reivindicado inicialmente um mero custo de treinamento de US $ 6 milhões, uma aparência mais próxima revela um investimento muito mais substancial.

DeepSeek TestImagem: Ensigame.com

A arquitetura inovadora da DeepSeek V3 é a chave para seu desempenho. Ele aproveita:

  • Previsão de vários toques (MTP): Prevendo várias palavras simultaneamente para aumentar a precisão e a velocidade.
  • Mistura de especialistas (MOE): Utilizando 256 redes neurais (oito ativos por token) para treinamento acelerado e desempenho aprimorado.
  • Atenção latente de várias cabeças (MLA): Extraindo repetidamente as informações importantes dos fragmentos de texto para minimizar a perda crucial dos detalhes.

DeepSeek V3Imagem: Ensigame.com

No entanto, a semiânica revelou a verdadeira infraestrutura da Deepseek: aproximadamente 50.000 GPUs NVIDIA Hopper (incluindo unidades H800, H100 e H20) se espalham por vários data centers. Isso representa um investimento total do servidor de aproximadamente US $ 1,6 bilhão, com custos operacionais estimados em US $ 944 milhões. Isso contradiz a reivindicação inicial de US $ 6 milhões, que cobriu apenas o uso de GPU pré-treinamento, excluindo pesquisas, refinamento, processamento de dados e infraestrutura.

A Deepseek, uma subsidiária da High-Flyer, um fundo de hedge chinês, possui seus data centers, diferentemente dos concorrentes dependentes da nuvem. Essa abordagem autofinanciada permite inovação e implementação rápidas. A empresa atrai os principais talentos chineses, com alguns pesquisadores ganhando mais de US $ 1,3 milhão anualmente.

DeepSeekImagem: Ensigame.com

O investimento real da Deepseek no desenvolvimento da IA ​​excede US $ 500 milhões. Enquanto sua estrutura magra promove a eficiência, a narrativa do "orçamento revolucionário" é enganoso. O verdadeiro sucesso decorre de investimentos substanciais, avanços tecnológicos e uma equipe altamente qualificada.

DeepSeekImagem: Ensigame.com

Apesar das reivindicações de custo inicial infladas, os custos de treinamento de modelos da Deepseek (US $ 5 milhões em R1) ainda são significativamente menores do que os concorrentes como ChatGPT4O (US $ 100 milhões), destacando uma vantagem competitiva. O exemplo do Deepseek mostra um caminho para o sucesso para empresas de IA independentes e bem financiadas, mas a realidade é muito mais cara do que o retratado inicialmente.