DeepSeek AI Bất ngờ: Phát triển tỷ đô được tiết lộ

Tác giả : Jason Feb 24,2025

Mô hình AI rẻ tiền đáng ngạc nhiên của Deepseek, Deepseek V3, đã làm rung chuyển thế giới công nghệ, gây ra sự sụt giảm đáng kể về giá cổ phiếu của NVIDIA. Trong khi Deepseek ban đầu tuyên bố chỉ có chi phí đào tạo 6 triệu đô la, một cái nhìn gần hơn cho thấy một khoản đầu tư đáng kể hơn nhiều.

DeepSeek TestHình ảnh: Obligame.com

Kiến trúc sáng tạo của DeepSeek V3 là chìa khóa cho hiệu suất của nó. Nó tận dụng:

  • Dự đoán đa điểm (MTP): Dự đoán đồng thời nhiều từ để tăng độ chính xác và tốc độ.
  • Hỗn hợp các chuyên gia (MOE): Sử dụng 256 mạng thần kinh (tám hoạt động trên mỗi mã thông báo) để đào tạo tăng tốc và cải thiện hiệu suất.
  • Sự chú ý tiềm ẩn đa đầu (MLA): Liên tục trích xuất thông tin chính từ các đoạn văn bản để giảm thiểu tổn thất chi tiết quan trọng.

DeepSeek V3Hình ảnh: Obligame.com

Tuy nhiên, Semianalysis cho thấy cơ sở hạ tầng thực sự của Deepseek: khoảng 50.000 GPU phễu NVIDIA (bao gồm các đơn vị H800, H100 và H20) trải rộng trên nhiều trung tâm dữ liệu. Điều này thể hiện tổng đầu tư của máy chủ khoảng 1,6 tỷ đô la, với chi phí hoạt động ước tính khoảng 944 triệu đô la. Điều này mâu thuẫn với yêu cầu 6 triệu đô la ban đầu, chỉ bao gồm việc sử dụng GPU trước khi đào tạo, không bao gồm nghiên cứu, tinh chỉnh, xử lý dữ liệu và cơ sở hạ tầng.

Deepseek, một công ty con của High Flyer, một quỹ phòng hộ của Trung Quốc, sở hữu các trung tâm dữ liệu của mình, không giống như các đối thủ cạnh tranh dựa trên đám mây. Cách tiếp cận tự tài trợ này cho phép đổi mới và thực hiện nhanh chóng. Công ty thu hút tài năng hàng đầu của Trung Quốc, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm.

DeepSeekHình ảnh: Obligame.com

Đầu tư thực tế của Deepseek vào phát triển AI vượt quá 500 triệu đô la. Trong khi cấu trúc nạc của nó thúc đẩy hiệu quả, thì câu chuyện "Ngân sách cách mạng" là sai lệch. Thành công thực sự bắt nguồn từ đầu tư đáng kể, tiến bộ công nghệ và một nhóm có tay nghề cao.

DeepSeekHình ảnh: Obligame.com

Mặc dù có các yêu cầu chi phí ban đầu được tăng cường, chi phí đào tạo mô hình DeepSeek, (5 triệu đô la cho R1) vẫn thấp hơn đáng kể so với các đối thủ cạnh tranh như TATGPT4O (100 triệu đô la), nhấn mạnh lợi thế cạnh tranh. Ví dụ Deepseek cho thấy một con đường dẫn đến thành công cho các công ty AI độc lập được tài trợ tốt, nhưng thực tế đắt hơn nhiều so với được miêu tả ban đầu.