Видеомодель ByteDance Seedance 2.0 взорвалась за рубежом, Маск восхищался «слишком быстрой разработкой», модель полностью связана с Doubao, Jimeng и открыта для корпоративных испытаний, а серия масштабных обновлений, таких как Doubao model 2.0, выйдет 14 февраля.
(Резюме: материнская компания TikTok ByteDance потратила 230 миллиардов долларов!) планирует захватить право на выживание в ИИ в 2026 году)
(Справочное дополнение: инструмент генерации видео Sora от OpenAI официально запущен!) 5 основных особенностей, планы подписки в кратком обзоре)
Содержание этой статьи
Видеомодель ByteDance Seedance 2.0 взорвалась за рубежом, и Маск восхищался «слишком быстрой разработкой». Модель полностью связана с Doubao и Jimeng, одновременно открыта для корпоративных испытаний, а её возможности «мультимодального входа» и «многообъективного длинного повествования» напрямую ориентированы на профессиональные производственные сценарии. ByteDance признаёт, что её продукты лидируют, но далеки от совершенства, и продолжит исследовать глубокую связь между крупными моделями и человеческой обратной связью. Модель Doubao 2.0 выйдет 14 февраля.
Генеративные видеомодели ускоряют появление в массовом продуктовом и корпоративном инструментарии. Маск прокомментировал «Это происходит быстро» на X, что ещё больше усилило внимание рынка к скачку в возможностях генерации видео.
Последние новости исходят из социальных платформ. Маск прокомментировал твиты, связанные с Seedance 2.0 на X, и выразил сожаление по поводу быстрой разработки, которая продолжает увеличивать обсуждения этой модели за рубежом, а также внимание внешнего мира к её управляемости и производственным мощностям.
ByteDance сегодня опубликовал чёткий сигнал продукта. Seedance 2.0 был официально выпущен, полностью связан с продуктами Doubao и Dream, а также одновременно запущен Volcano Ark Experience Center, открытый для пользователей для тестирования. Модель сосредоточена на синхронизации звука и изображения, многокадровом длинном повествовании, мультимодальной управляемой генерации и других возможностях, указывая на более широкий спектр создателей и коммерческих сценариев контента.
Однако компания сохраняет сдержанность в своих заявлениях. Официальный аккаунт ByteDance в Weibo отметил, что Seedance 2.0 «далёк от совершенства», а полученные результаты всё ещё имеют множество недостатков, и в будущем будет продолжать исследовать глубокую связь между крупными моделями и человеческой обратной связью. Для участников рынка такая комбинация «высокая экспозиция + быстрая продуктовая разработка + непрерывная итерация» укрепляет ожидания ускоренной конкуренции на треке генерации видео.
После начала закрытого тестирования Seedance 2.0 она привлекла большое внимание по всему миру благодаря мультимодальному способу создания и эффекту «встроенного движения камеры». Ретвит Маска на X и комментарий «Это происходит быстро» ещё больше распространили распространение модели от технологического круга до более широкого круга технологических инвестиций и продуктовых интересов.
Публичная оценка Маска, хотя и не включает конкретные технические детали, усиливает рыночный нарратив о «скорости разработки». Этот сигнал поможет привлечь внимание внешнего мира к мультимодальным возможностям ByteDance, а также может оказать незначительное влияние на ожидания по оценке связанных отраслевых сетей.
ByteDance сегодня объявила, что модель генерации видео с мешками Seedance 2.0 официально подключена к приложению Doubao, компьютерной и веб-версии, полностью связана с продуктами Doubao и Dream, а также запущена в Volcano Ark Experience Center для пользователей, чтобы они могли попробовать и испытать её.
Для предприятий ByteDance заявила, что ожидает, что в середине-конце февраля на Volcano Ark будет запущен сервис API Seedance 2.0, чтобы помочь корпоративным клиентам лучше реализовать свои идеи. Это означает, что Seedance 2.0 позиционируется не только как инструмент для создания инструмента, но и как подготовка к более стандартизированным звонкам на стороне B.
Позиционирование ByteDance Seedance 2.0 делает акцент на «качестве и управляемости для соответствия требованиям профессиональных производственных сценариев». Ключевые сигналы с функциональной стороны включают:
Мультимодальный ввод, поддерживающий текст, изображение, аудио, видео, четыре модальных смешанных входа, касающихся композиции, действия, движения камеры, спецэффектов, звука и других элементов.
Синхронизация и многодорожечный параллельный выход оригинального звука и изображения, поддерживающий многодорожечный аудиовыход, такой как фоновая музыка, фоновые звуковые эффекты или комментарии персонажей, и акцент на согласовании с ритмом изображения.
Многокадровый длинный нарратив и «режиссёрское мышление», модель может автоматически анализировать повествовательную логику, генерировать кадровые сцены и сохранять единство персонажей, света и тени, стиля и атмосферы.
Добавлены возможности видеомонтажа и расширения видео для улучшения характеристик рабочего процесса «Director-level Control».
ByteDance также отметила, что Seedance 2.0 лучше решает такие задачи, как соблюдение физических законов и долгосрочная согласованность, а уровень доступности генерации в спортивных сценариях достигает отраслевого уровня SOTA.
ByteDance отметила, что комплексная производительность Seedance 2.0 достигла ведущего в отрасли уровня, но всё ещё есть потенциал для оптимизации, включая стабильность деталей, многопопуляционное сопоставление, многосубъектную согласованность, точность восстановления текста и сложные эффекты редактирования и т.д., и продолжит исследовать глубокое согласование между крупными моделями и человеческой обратной связью.
Границы между соблюдением требований и использованием также становятся яснее. ByteDance отметил, что Seedance 2.0 в настоящее время ограничивает использование изображений или видео реальных людей в качестве тематических референсов, и если вам нужно использовать реальных людей в качестве реальных рекомендов, необходимо проверить или получить разрешение. Такие ограничения напрямую повлияют на использование некоторых коммерческих каналов производства и доставки материалов.
ByteDance Volcano Engine изначально подтвердил, что выпустит серию важных обновлений модели Doubao 14 февраля 2026 года, включающих модель Doubao 2.0, аудио- и видео создание Seedance 2.0, а также модель создания изображений Seedream 5.0 Preview, а также заявил, что базовые возможности модели и возможности агентов на корпоративном уровне будут значительно улучшены.
Учитывая внешнее сожаление Маска о слишком высокой скорости разработки, рынок обратит больше внимания на два момента: во-первых, соответствуют ли запуск API Seedance 2.0 и скорость внедрения на корпоративной стороне с нарративом продукта, а во-вторых, поддерживают ли темпы улучшения модели в плане согласованности, синхронизации губ и сложного редактирования её от «взрывных демонстраций» до «стабильной продуктивности».