Deepseek AI Apprises : 10 억 달러 규모의 개발이 발표되었습니다

작가 : Jason Feb 24,2025

DeepSeek의 놀랍도록 저렴한 AI 모델 인 DeepSeek V3는 기술 세계를 흔들어 Nvidia의 주가가 크게 하락했습니다. DeepSeek은 처음에는 6 백만 달러의 훈련 비용을 주장했지만 자세히 살펴보면 훨씬 더 많은 투자가 나타납니다.

DeepSeek Test이미지 : ensigame.com

DeepSeek V3의 혁신적인 아키텍처는 성능의 핵심입니다. 활용 :

  • MTP (Multi-Token Prediction) : 정확도와 속도를 높이기 위해 여러 단어를 동시에 예측합니다.
  • 전문가 혼합 (MOE) : 가속화 된 훈련 및 개선 된 성능을 위해 256 개의 신경망 (토큰 당 8 개 활성) 사용.
  • 멀티 헤드 잠재주의 (MLA) : 중요한 세부 손실을 최소화하기 위해 텍스트 조각에서 주요 정보를 반복적으로 추출합니다.

DeepSeek V3이미지 : ensigame.com

그러나 Semianalysis는 DeepSeek의 진정한 인프라를 나타 냈습니다. 약 50,000 개의 NVIDIA HOPPER GPU (H800, H100 및 H20 장치 포함)가 여러 데이터 센터에 퍼져 있습니다. 이는 약 16 억 달러의 총 서버 투자를 나타내며 운영 비용은 9 억 9,400 만 달러로 추정됩니다. 이는 연구, 정제, 데이터 처리 및 인프라를 제외한 사전 훈련 GPU 사용 만 포함하는 초기 6 백만 달러의 청구와 모순됩니다.

중국 헤지 펀드 인 High-Flyer의 자회사 인 Deepseek는 클라우드 관련 경쟁 업체와 달리 데이터 센터를 소유하고 있습니다. 이 자체 지원 접근 방식은 빠른 혁신과 구현을 허용합니다. 이 회사는 중국 최고의 인재를 유치하며 일부 연구자들은 매년 130 만 달러 이상을 벌고 있습니다.

DeepSeek이미지 : ensigame.com

AI 개발에 대한 DeepSeek의 실제 투자는 5 억 달러를 초과합니다. 린 구조는 효율성을 조성하지만 "혁명 예산"이야기는 오해의 소지가 있습니다. 진정한 성공은 상당한 투자, 기술 발전 및 고도로 숙련 된 팀에서 비롯됩니다.

DeepSeek이미지 : ensigame.com

초기 비용 주장에도 불구하고 DeepSeek의 모델 교육 비용 (R1의 경우 5 백만 달러)은 ChatGPT4O (1 억 달러)와 같은 경쟁 업체보다 여전히 상당히 낮아서 경쟁 우위를 강조합니다. Deepseek 예는 잘 자금을 지원하고 독립적 인 AI 회사의 성공의 길을 보여 주지만, 현실은 처음에 묘사 된 것보다 훨씬 비싸다.