Seedance 2.0 революціонізує індустрію кіно! AI від ByteDance за кілька хвилин виконує роботу команди спецефектів, яка зазвичай займає сотні годин

MarketWhisper

ByteDance випустила модель відео AI Seedance 2.0, і засновник видання «Кінематографічний ураган» Тім у своєму огляді зазначив, що вона зробила значний прорив у операторах камери, монтажі та звуковому супроводі. Однак Тім виявив, що модель автоматично додала його голос без дозволу, і він ніколи не отримував за це плату. «Кінематографічний ураган» побоюється, що AI може ідеально імітувати цифрових двійників, важко відрізнити правду від фальші. План розбиття сценарію прогнозує, що кіно поділяться на два шляхи: ігровий та занурювальний або повернення до соціальної функції.

Технічний прорив Seedance 2.0: від жорсткості до плавності

Остання модель відео AI від ByteDance Seedance 2.0 з’явилася на ринку скромно, але засновник «Кінематографічного урагану» Тім у новому відео високо оцінив її. На відміну від попередніх проблем із жорсткими операторами камери, Тім вважає, що Seedance 2.0 здатна обробляти широкі та плавні рухи камери — це значний прорив у сфері генерації відео AI.

Раніше інструменти для створення відео AI, такі як Runway, Pika, хоча й могли генерувати зображення, але рух камери був механічним і неестетичним. Типові проблеми включали раптові зміни швидкості зсуву, нерівномірні рухи зйомки, відсутність «дихання» у професійних операторів. Ці недоліки дозволяли легко відрізнити AI-згенероване відео від справжнього, що не відповідало стандартам професійної кіновиробництва. Прорив Seedance 2.0 полягає в тому, що вона може імітувати логіку оператора, включаючи плавне прискорення та гальмування, природні переходи фокусування та естетичний підхід до композиції.

Покращення сценарного планування має ще більш революційне значення. Тім зазначає, що AI демонструє логіку режисера, здатного переключати точки зору для кращої оповідної логіки і зберігати цілісність персонажів. У традиційному кіновиробництві сценарний план — це основна робота режисера і оператора, що враховує ритм, емоційний настрій і візуальну цілісність. Seedance 2.0 може розуміти логіку сценарію і автоматично створювати логічні переходи між кадрами, що означає перехід AI від просто інструменту створення зображень до помічника з режисерським мисленням.

Покращення відповідності звуку та зображення також вражає. Seedance 2.0 здатна одним натисканням генерувати природні голосові підказки та мікси навколишнього звуку, значно спрощуючи трудомісткий процес постпродакшну. У традиційному кіновиробництві звуковий дизайн — це висококваліфікована і тривала робота. Для сцени довжиною в дві хвилини професійний звукоінженер може витратити кілька днів на очищення діалогів, запис навколишніх звуків, створення ефектів і мікшування. Seedance 2.0 зменшує цей час до кількох хвилин, підвищуючи ефективність у тисячі разів.

Три головні технологічні прориви Seedance 2.0

Плавне операторство: імітація логіки руху камери та композиції, прощавай жорсткість AI

Режисерський сценарний план: розуміння логіки оповіді і автоматичне створення переходів, збереження цілісності персонажів

Одним натисканням звуковий дизайн: автоматичне створення голосів і навколишніх звуків, спрощення постпродакшну

З технічної точки зору, ці прориви, ймовірно, базуються на більш масштабних даних для тренування та передових моделях послідовностей. Seedance 2.0, швидше за все, використовує варіації архітектури Transformer, поєднані з дифузійними моделями та GAN (генеративними змагальними мережами), треновані на величезних масивах професійних кіновиробів. Платформи ByteDance, такі як Douyin і TikTok, мають найбільшу у світі базу коротких відео, що забезпечує Seedance 2.0 унікальними ресурсами для навчання.

Несанкціоноване цифрове клонування: питання авторських прав і етики

Хоча технологія Seedance 2.0 потужна, «Кінематографічний ураган» також виявив потенційні ризики. Тім з’ясував, що, завантаживши лише свої фотографії без голосових файлів, модель здатна ідентифікувати його особу і автоматично додати його голос. Навіть після завантаження фото фасаду офісу «Кінематографічного урагану», AI точно обчислює деталі будівлі за межами кадру.

Тім зазначив, що він ніколи не отримував дозволу від ByteDance і не був з ними зв’язаний. Це свідчить, що Seedance 2.0, можливо, без відома користувачів, використовує великі обсяги даних з відео та голосів кінематографістів для глибокого навчання. Такий підхід викликає серйозні питання щодо авторських прав. У більшості юрисдикцій особисте зображення і голос захищені законом, і несанкціоноване використання таких даних для комерційного навчання може бути порушенням.

Тім побоюється, що, якщо AI отримає повний набір особистих аудіовізуальних даних, він зможе ідеально імітувати правду і фальш, створюючи цифрових двійників, важко відрізнити від реальних. Це може ускладнити розпізнавання близьких і навіть членів родини, викликаючи серйозні етичні та правові проблеми. Не випадково, з розвитком Deepfake з’являються випадки шахрайства з використанням синтезованих відео знаменитостей. Якщо Seedance 2.0 потрапить у неправильні руки, можливі крадіжки особистості, фальшиві новини і фінансові шахрайства.

Глибше питання — прозорість тренувальних даних. ByteDance ніколи не оприлюднював джерела даних для Seedance 2.0. Якщо модель тренувалася на відкритих відео користувачів, чи знали вони про це? Чи погоджувалися? Чи мають вони право на компенсацію? Ці питання залишаються без чіткої правової регуляції у світі. Європейський закон про штучний інтелект і кілька американських ініціатив намагаються створити відповідні норми, але їх застосування ще невідоме.

З галузевої точки зору, якщо Seedance 2.0 зможе без дозволу копіювати стиль, голос і зовнішність будь-якого творця, цінність контенту руйнується. Творці, які роками формували свій бренд і унікальний стиль, можуть за кілька хвилин бути повністю відтворені AI. Це не лише економічна втрата, а й фундаментальна загроза ідентичності творця.

Що залишилось кінематографістам? Неперевершений досвід і фізичне тіло

Тім вважає, що, хоча Seedance 2.0 ще не ідеальна, наступна версія може кардинально змінити індустрію. Раніше команда спецефектів витрачала сотні годин на створення кадрів, тепер AI робить це за кілька хвилин, що швидко знецінює професійні навички. Коли вклад і ефективність праці не можуть конкурувати з AI, Тім у кінці відео запитує: «AI руйнує захисний мур традиційного кіновиробництва, але чи це добре чи погано для людства?»

«Кінематографічний ураган» у відео «AI може замінити мене, тоді яка моя цінність?» підсумовує: «Досвід». Він формує унікальну душу кожної людини. Коли ви бачите сиве волосся матері, заходите у колишню школу, відчуваєте запах класу — AI цього не зрозуміє. Паровий локомотив для AI занадто повільний і дурний, але для людини він наповнений спогадами про розлуки і надії на зустріч.

Відомий кінор critic «План розрізу», що має майже 2 мільйони підписників на Bilibili, вважає, що AI можливо й має необмежні дані, але єдина істинна цінність — це людське тіло, яке є вразливим і недосконалим, але справжнім. Вона зазначає, що сучасна людина з дитинства занурена у зображення, і ще не встигла жити, пізнавати, сумувати і втрачати — і вже навчається виражати себе. Це призводить до того, що багато творінь — це швидше форма для створення змісту, а не його суть, тому ці образи більше нагадують імітацію снів, ніж самі сни.

Переглянути оригінал
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів