Deepseek AI Niespodzianki: zaprezentowany rozwój miliardów dolarów
Zaskakująco niedrogi model AI, Deepseek V3, wstrząsnął światem technologii, powodując znaczny spadek ceny akcji Nvidia. Podczas gdy Deepseek początkowo domagał się zaledwie 6 milionów dolarów kosztów szkolenia, bliższe spojrzenie ujawnia znacznie bardziej znaczącą inwestycję.
Obraz: engame.com
Innowacyjna architektura Deepseek V3 jest kluczem do jej wydajności. Wykorzystuje:
- Prognozowanie wielu tokenów (MTP): Prognozowanie wielu słów jednocześnie pod kątem zwiększonej dokładności i szybkości.
- Mieszanka ekspertów (MOE): Wykorzystanie 256 sieci neuronowych (osiem aktywnych na token) do przyspieszonego szkolenia i poprawy wydajności.
- Uczciwa uwaga wielowłócona (MLA): Wielokrotne wyodrębnienie kluczowych informacji z fragmentów tekstu, aby zminimalizować kluczową utratę szczegółów.
Obraz: engame.com
Jednak semianaliza ujawniła prawdziwą infrastrukturę Deepseek: około 50 000 GPU Nvidia Hopper (w tym jednostki H800, H100 i H20) rozprzestrzeniło się w wielu centrach danych. Stanowi to całkowita inwestycja serwerowa w wysokości około 1,6 miliarda USD, przy czym koszty operacyjne są szacowane na 944 mln USD. Jest to sprzeczne z początkowym roszczeniem o wartości 6 milionów dolarów, które obejmowało jedynie wykorzystanie GPU przed treningiem, wykluczając badania, udoskonalanie, przetwarzanie danych i infrastrukturę.
Deepseek, spółka zależna High-Flyer, chińskiego funduszu hedgingowego, jest właścicielem swoich centrów danych, w przeciwieństwie do konkurencji w chmurze. To samofinansowane podejście pozwala na szybkie innowacje i wdrożenie. Firma przyciąga najlepsze chińskie talenty, a niektórzy badacze zarabiają ponad 1,3 miliona dolarów rocznie.
Obraz: engame.com
Rzeczywista inwestycja Deepseek w rozwój AI przekracza 500 milionów dolarów. Podczas gdy jego szczupła struktura sprzyja wydajności, narracja „rewolucyjna budżet” jest myląca. Prawdziwy sukces wynika z znacznych inwestycji, postępów technologicznych i wysoce wykwalifikowanego zespołu.
Obraz: engame.com
Pomimo zawyżonych wniosków o początkowe koszty, modelowe koszty szkolenia Deepseek (5 milionów dolarów za R1) są nadal znacznie niższe niż konkurenci, tacy jak Chatgpt4o (100 milionów dolarów), co podkreśla przewagę konkurencyjną. Depeek pokazuje drogę do sukcesu dobrze finansowanych, niezależnych firm AI, ale rzeczywistość jest o wiele droższa niż początkowo przedstawiona.






