DeepSeek V4: бесшумный переход системы с Nvidia на Huawei

Правительство

DeepSeek V4: бесшумный переход системы с Nvidia на Huawei

Логотип DeepSeek на мобильном телефоне

DeepSeek выпустила свою новую модель искусственного интеллекта V4 — более мощную, дешевую и впервые на чипах Huawei. Что это означает для суверенитета Китая в области искусственного интеллекта?

Спустя более года после так называемого «шока от DeepSeek», базирующийся в Ханчжоу стартап DeepSeek в области искусственного интеллекта выпустил в пятницу свою новую базовую модель V4 в предварительной версии.

Подробности читайте после рекламы

Модель с открытым исходным кодом представлена ​​в двух вариантах: более мощный V4-Pro с 1,6 триллиона параметров — крупнейшая модель компании на сегодняшний день по этому показателю — и меньший по размеру и более экономичный V4-Flash с 284 миллиардами параметров. Параметры — это управляемые переменные, которые уточняют способность модели ИИ принимать решения.

Выдающейся новой функцией в обеих версиях является контекстное окно из миллиона токенов — это объем информации, который модель может обработать одновременно.

Для сравнения: предыдущая флагманская модель DeepSeek имела 128 000 токенов. DeepSeek охарактеризовал эффективность, с которой такая длина контекста была достигнута на китайской платформе WeChat, как «ведущую в мире» и рассказал о «резком сокращении затрат на вычисления и хранение».

DeepSeek представил подробные технические подробности о новой модели в техническом отчете.

Поворотный момент для отрасли

Чжан И, основатель исследовательской компании в области технологий iiMedia, назвал этот релиз «настоящим поворотным моментом для отрасли». До сих пор обработка длинных текстов была связана с более высокими затратами и меньшей скоростью. «Поскольку поддержка сверхбольших контекстов становится стандартом, обработка длинных текстов должна перейти из узкоспециализированных исследовательских лабораторий в коммерческое направление», — сказал он АФП.

Подробности читайте после рекламы

Нил Шах, вице-президент по исследованиям аналитического центра Исследование контрапунктасообщил V4 американскому изданию CNBC представила «серьезные доказательства» силы DeepSeek и указала на более низкие затраты на выводы, чем предыдущие модели. Затраты на вывод — это вычислительные и финансовые затраты, которые возникают при работе с обученной моделью ИИ.

Вэй Сунь, старший аналитик по искусственному интеллекту в Контрапунктдобавил, что профиль тестов V4 указывает на «отличные возможности агента при значительно более низкой цене».

Стол

В самой DeepSeek заявили, что модель оптимизирована для популярных инструментов ИИ-агентов, таких как Claude Code, OpenClaw и CodeBuddy. По данным компании, V4-Pro значительно опережает другие модели с открытым исходным кодом в мировых тестах знаний и лишь немного уступает закрытой модели Google Gemini-Pro-3.1.

Чипы Huawei вместо Nvidia

Особое внимание уделено вопросу о том, какие чипы установлены в новой модели. Цифровая среда США Информация По словам V4, он будет работать на новейших чипах искусственного интеллекта Huawei, для которых он оптимизирован.

Сообщается, что в рамках подготовки к запуску китайские технологические компании, такие как Alibaba, ByteDance и Tencent, разместили крупные заказы на будущий чип Huawei, порядка сотен тысяч единиц. Рейтер со ссылкой на пять человек, знакомых с ситуацией.

В пятницу компания Huawei подтвердила, что ее новейший вычислительный кластер искусственного интеллекта на базе процессоров Ascend может поддерживать DeepSeeks V4. Остается неясным, в какой степени в обучении использовались чипы Huawei по сравнению с чипами Nvidia.

Китайским разработчикам запрещено напрямую приобретать самые мощные чипы искусственного интеллекта Nvidia в соответствии с экспортным контролем США. Сообщается, что Пекин подталкивает китайские технологические компании к переходу на отечественные альтернативы.

Вэй Сунь из Контрапункт подчеркнул, что способность V4 работать на местных чипах может иметь далеко идущие последствия: это поможет Пекину получить больше суверенитета в области искусственного интеллекта и еще больше снизить его зависимость от Nvidia. «В конечном итоге это ускорит общее глобальное развитие искусственного интеллекта», — сказала она. После этого объявления акции китайских контрактных производителей чипов в Гонконге резко выросли: SMIC выросли на 8,9 процента, Hua Hong Semiconductor даже на 15,2 процента.

Рейтер Ранее сообщалось, что DeepSeek не представила свою новую флагманскую модель производителям микросхем в США для оптимизации производительности, что является отходом от обычной практики перед крупными обновлениями модели. Вместо этого отечественные поставщики, включая Huawei, получили ранний доступ.

Не второй «момент спутника», а массовое размещение

В январе 2025 года DeepSeek встряхнула мировые технологические рынки своей моделью рассуждения R1. Модель достигла показателей, аналогичных ведущим системам США, но, по словам компании, она была разработана всего за два месяца и менее чем за шесть миллионов долларов — с использованием менее мощных чипов Nvidia. Это напугало инвесторов и вызвало вопросы о лидерстве США в области искусственного интеллекта и миллиардах долларов, потраченных крупными технологическими компаниями на инфраструктуру искусственного интеллекта.

Аналитики сомневаются, что V4 будет иметь аналогичный рыночный эффект. Иван Су, старший аналитик по акциям компании Морнингстарсказал противоположное CNBCпубликация вряд ли встряхнет рынок в такой же степени, поскольку инвесторы уже оценили конкурентоспособность и экономическую эффективность китайского ИИ.

Тем не менее, он указал на новое стратегическое измерение: с помощью V4 DeepSeek впервые явно позиционирует себя против других китайских моделей с открытым исходным кодом как прямых конкурентов. «Такой структуры не существовало в R1, и уже одно это показывает, насколько усилилась внутренняя конкуренция», — сказал Су.

Фактически, после анонса V4 акции других китайских компаний, занимающихся искусственным интеллектом, упали в Гонконге: MiniMax и Zhipu потеряли примерно по восемь процентов каждая, а Manycore Tech упала на девять процентов.

В самом Китае инструменты DeepSeek уже широко используются: муниципалитеты, учреждения здравоохранения, финансовый сектор и другие компании приняли эти модели, чему способствовало решение DeepSeek опубликовать свои системы с открытым исходным кодом, что представляет собой контраст с проприетарными моделями западных поставщиков, таких как OpenAI.