Deepseek AI Surprisise: เปิดตัวการพัฒนาพันล้านดอลลาร์

ผู้เขียน : Jason Feb 24,2025

Deepseek AI Surprisise: เปิดตัวการพัฒนาพันล้านดอลลาร์

Deepseek V3 รุ่น Deepseek ที่น่าประหลาดใจของ Deepseek ได้เขย่าโลกเทคโนโลยีทำให้ราคาหุ้นของ Nvidia ลดลงอย่างมาก ในขณะที่ Deepseek เริ่มแรกอ้างว่ามีค่าใช้จ่ายในการฝึกอบรมเพียง $ 6 ล้าน แต่การมองอย่างใกล้ชิดเผยให้เห็นการลงทุนที่สำคัญยิ่งขึ้น

IMGP%Image: Ensigame.com

สถาปัตยกรรมที่เป็นนวัตกรรมของ Deepseek V3 เป็นกุญแจสำคัญในการแสดง มันใช้ประโยชน์:

  • การทำนายแบบมัลติเทน (MTP): ทำนายหลายคำพร้อมกันเพื่อเพิ่มความแม่นยำและความเร็ว
  • ส่วนผสมของผู้เชี่ยวชาญ (MOE): ใช้เครือข่ายประสาท 256 (แปดต่อโทเค็นที่ใช้งานอยู่) สำหรับการฝึกอบรมเร่งความเร็วและประสิทธิภาพที่ดีขึ้น
  • ความสนใจแฝงหลายหัว (MLA): การสกัดข้อมูลคีย์ซ้ำ ๆ จากชิ้นส่วนข้อความเพื่อลดการสูญเสียรายละเอียดที่สำคัญ

IMGP%Image: Ensigame.com

อย่างไรก็ตาม Semianalysis เปิดเผยโครงสร้างพื้นฐานที่แท้จริงของ Deepseek: ประมาณ 50,000 Nvidia Hopper GPU (รวมถึง H800, H100 และ H20 หน่วย) กระจายไปทั่วศูนย์ข้อมูลหลายแห่ง สิ่งนี้แสดงให้เห็นถึงการลงทุนเซิร์ฟเวอร์ทั้งหมดประมาณ 1.6 พันล้านดอลลาร์โดยมีค่าใช้จ่ายในการดำเนินงานอยู่ที่ 944 ล้านดอลลาร์ สิ่งนี้ขัดแย้งกับการเรียกร้องเริ่มต้น $ 6 ล้านซึ่งครอบคลุมเฉพาะการใช้งาน GPU ก่อนการฝึกอบรมไม่รวมการวิจัยการปรับแต่งการประมวลผลข้อมูลและโครงสร้างพื้นฐาน

Deepseek ซึ่งเป็น บริษัท ย่อยของ High-Flyer ซึ่งเป็นกองทุนป้องกันความเสี่ยงจีนเป็นเจ้าของศูนย์ข้อมูลซึ่งแตกต่างจากคู่แข่งที่พึ่งพาคลาวด์ วิธีการที่ได้รับทุนด้วยตนเองนี้ช่วยให้นวัตกรรมและการนำไปใช้งานได้อย่างรวดเร็ว บริษัท ดึงดูดความสามารถพิเศษของจีนโดยมีนักวิจัยบางคนมีรายได้มากกว่า 1.3 ล้านเหรียญสหรัฐต่อปี

IMGP%Image: Ensigame.com

การลงทุนที่แท้จริงของ Deepseek ในการพัฒนา AI เกินกว่า $ 500 ล้าน ในขณะที่โครงสร้างแบบลีนส่งเสริมประสิทธิภาพการเล่าเรื่อง "การปฏิวัติงบประมาณ" นั้นทำให้เข้าใจผิด ความสำเร็จที่แท้จริงเกิดจากการลงทุนที่สำคัญความก้าวหน้าทางเทคโนโลยีและทีมงานที่มีทักษะสูง

IMGP%Image: Ensigame.com

แม้จะมีการเรียกร้องค่าใช้จ่ายเริ่มต้นที่สูงเกินจริงค่าใช้จ่ายในการฝึกอบรมแบบจำลองของ Deepseek ($ 5 ล้านสำหรับ R1) ยังคงต่ำกว่าคู่แข่งอย่าง CHATGPT4O ($ 100 ล้าน) อย่างมากโดยเน้นถึงความได้เปรียบในการแข่งขัน ตัวอย่าง Deepseek นำเสนอเส้นทางสู่ความสำเร็จสำหรับ บริษัท AI ที่ได้รับการสนับสนุนและได้รับการสนับสนุนอย่างดี แต่ความเป็นจริงนั้นมีราคาแพงกว่าที่แสดงในตอนแรก