DeepSeek — базирующаяся в Ханчжоу компания в сфере искусственного интеллекта — добавила в основного чат-бота возможности распознавания изображений и видео благодаря новой функции «режим распознавания изображений», выведя его в соответствие с другими крупными ИИ-чат-ботами. Запуск совпал со значительной вехой в цепочке поставок чипов в Китае: четыре отечественные полупроводниковые компании — Huawei Ascend, Cambricon, Hygon Information и Moore Threads — подтвердили поддержку новейшей флагманской модели DeepSeek, DeepSeek-V4, в тот же день, что стало сдвигом по сравнению с типичными для прошлых месяцев длительными периодами адаптации, характерными для решений вне экосистемы Nvidia.
DeepSeek незаметно запустила режим распознавания изображений вместе с двумя другими режимами, которые были представлены ранее в этом месяце: «expert» и «flash». Как отметил Чэнь Сяокан (Chen Xiaokang), возглавляющий мультимодальную команду DeepSeek, инструмент впервые протестировали на небольшой группе пользователей как на веб-сайте, так и в мобильном приложении. Чэнь Делий (Chen Deli), старший исследователь компании, отпраздновал запуск постом с отсылкой к логотипу компании: «Маленький кит теперь может видеть».
Функция для изображений и видео появилась спустя всего несколько дней после того, как DeepSeek выпустила превью DeepSeek-V4 и сделала веса модели доступными для публичной загрузки и использования. V4 построена как две отдельные модели: DeepSeek-V4-Pro с 1,6 трлн параметров, предназначенная для сложного рассуждения и многошаговых автоматизированных рабочих процессов, и DeepSeek-V4-Flash, оптимизированная для обработки больших объемов запросов с более низкой стоимостью. Обе модели поддерживают контекстное окно на один миллион токенов и используют гибридный дизайн внимания, который, по заявлению компании, снижает требования к вычислительным ресурсам и памяти во время инференса.
То, что привлекло внимание индустрии, было не только самой моделью, но и скоординированной аппаратной поддержкой, продемонстрированной в день релиза V4. Huawei Ascend подтвердила совместимость с ее чипами A2, A3 и 950: Ascend 950 использует слияние вычислительных процессов и параллельные потоки обработки, чтобы ускорить инференс как для V4-Pro, так и для V4-Flash. Cambricon завершила адаптацию, используя открытое исходное окружение vLLM для инференса, и опубликовала код на GitHub. Hygon Information выполнила глубокую оптимизацию модели на своей платформе DCU, чтобы обеспечить плавный переход от релиза модели к развертыванию. Moore Threads объединилась с Пекинской академией искусственного интеллекта, чтобы запустить V4 на своей карте MTT S5000, используя программный стек FlagOS.
Эта поддержка в тот же день по нескольким наборам микросхем представляет собой отход от исторических паттернов. Ранее аппаратное обеспечение вне экосистемы Nvidia обычно требовало месяцев, чтобы поддержать крупные новые модели. Наблюдатели отрасли отмечают, что достижение совместимости с четырьмя разными отечественными наборами чипов в день запуска сигнализирует о реальном сдвиге в зрелости китайской полупроводниковой и ИИ-инфраструктуры.
Более широкое значение запуска DeepSeek выходит за рамки отдельных технических достижений. Позволяя V4 нативно работать одновременно на нескольких китайских чипах, DeepSeek снижает риск зависимости от экспортных ограничений, которые исторически блокировали китайским компаниям доступ к самым передовым американским процессорам. Эффективность по стоимости остается в центре стратегии DeepSeek — компания делает приоритет на том, чтобы удерживать расходы на работу модели на низком уровне, позволяя бизнесу строить автоматизированные системы без непомерных затрат на вычисления.
Наблюдатели отрасли описывают этот релиз как отражающий созревание всей цепочки поставок, а не одного единственного технологического прорыва. Координация между DeepSeek, производителями чипов и программными фреймворками демонстрирует развитие интегрированной экосистемы. Такая траектория предполагает, что конкурентный ландшафт в ИИ смещается: фокус перестает быть на сложности отдельных моделей и переходит к способности поддерживать полностью, экономически эффективно и независимо работающие системы в долгосрочной перспективе.
Какие новые возможности DeepSeek добавила в своего чат-бота? DeepSeek добавила «режим распознавания изображений», который позволяет ее чат-боту понимать фотографии и видео, а не только текст. Эта функция впервые была протестирована на небольшой группе пользователей как на веб-сайте, так и в мобильном приложении, что поставило возможности DeepSeek в один ряд с другими крупными ИИ-чат-ботами, предлагающими аналогичные способности.
Какие китайские компании по производству чипов поддержали DeepSeek-V4 в день запуска? Четыре китайские компании по производству чипов подтвердили поддержку DeepSeek-V4 в тот же день: Huawei Ascend (с чипами A2, A3 и 950), Cambricon, Hygon Information и Moore Threads. Такая совместимость в день запуска для нескольких наборов микросхем ранее была редкостью вне экосистемы Nvidia и обычно требовала месяцев работы по адаптации.
Каковы две версии DeepSeek-V4 и чем они отличаются? DeepSeek-V4-Pro имеет 1,6 трлн параметров и предназначена для сложного рассуждения и многошаговых автоматизированных рабочих процессов, тогда как DeepSeek-V4-Flash оптимизирована для обработки больших объемов запросов с более низкой стоимостью. Обе поддерживают контекстное окно на один миллион токенов и используют гибридный дизайн внимания, чтобы снизить требования к вычислительным ресурсам и памяти.