DeepSeek AI сюрпризы: разработка на миллиард долларов.

Автор : Jason Feb 24,2025

Удивительно недорогая модель искусственного интеллекта Deepseek, Deepseek V3, потряс мир технологий, вызывая значительное снижение цены акций Nvidia. В то время как DeepSeek первоначально потребовал всего 6 миллионов долларов затрат на обучение, более пристальный взгляд показывает гораздо более существенные инвестиции.

DeepSeek TestИзображение: Ensigame.com

Инновационная архитектура DeepSeek V3 является ключом к ее производительности. Это использует:

  • Multi-Token Production (MTP): Прогнозирование нескольких слов одновременно для повышения точности и скорости.
  • Смесь экспертов (MOE): Использование 256 нейронных сетей (восемь активных за токен) для ускоренного обучения и улучшения производительности.
  • Многоугольное скрытое внимание (MLA): Повторно извлечение ключевой информации из фрагментов текста, чтобы минимизировать важную потерю детализации.

DeepSeek V3Изображение: Ensigame.com

Тем не менее, полуанализа выявил истинную инфраструктуру Deepseek: приблизительно 50 000 графических процессоров Nvidia Hopper (включая H800, H100 и H20), распространяющиеся по нескольким центрам обработки данных. Это составляет общие инвестиции в сервер в размере примерно 1,6 млрд. Долл. США, а эксплуатационные расходы оцениваются в 944 млн. Долл. США. Это противоречит первоначальной претензии в размере 6 миллионов долларов США, которая охватывала только предварительное использование графического процессора, исключая исследования, уточнение, обработку данных и инфраструктуру.

DeepSeek, дочерняя компания High-Flyer, китайского хедж-фонда, владеет своими центрами обработки данных, в отличие от конкурентов. Этот самофинансируемый подход допускает быстрое инновации и реализацию. Компания привлекает лучших китайских талантов, а некоторые исследователи зарабатывают более 1,3 миллиона долларов в год.

DeepSeekИзображение: Ensigame.com

Фактические инвестиции DeepSeek в развитие ИИ превышают 500 миллионов долларов. В то время как его бережливая структура способствует эффективности, повествование «революционный бюджет» вводит в заблуждение. Истинный успех проистекает из значительных инвестиций, технологических достижений и высококвалифицированной команды.

DeepSeekИзображение: Ensigame.com

Несмотря на завышенные первоначальные требования затрат, затраты на обучение Deepseek по модельной обучению (5 миллионов долларов США для R1) по -прежнему значительно ниже, чем конкуренты, такие как Catgpt4o (100 миллионов долларов США), что подчеркивает конкурентное преимущество. Пример DeepSeek демонстрирует путь к успеху для хорошо финансируемых независимых компаний ИИ, но реальность гораздо дороже, чем первоначально.