Seedance 2.0 Đổi mới ngành công nghiệp điện ảnh! AI của ByteDance hoàn thành hiệu ứng đặc biệt trong vài phút, tiết kiệm hàng trăm giờ làm việc của nhóm hiệu ứng đặc biệt

MarketWhisper

ByteDance công bố mô hình video AI Seedance 2.0, nhà sáng lập “影視颶風” Tim nhận xét rằng nó có những đột phá quan trọng về vận động máy quay, phân cảnh và âm thanh hình ảnh. Tuy nhiên, Tim phát hiện ra rằng mô hình tự động ghép giọng nói của ông mà không có sự cho phép, và ông chưa từng nhận được phí bản quyền nào. “影視颶風” lo ngại rằng AI có thể mô phỏng hoàn hảo các bản sao kỹ thuật số khó phân biệt thật giả. Kế hoạch cắt ghép dự đoán rằng phim sẽ đi theo hai hướng: hoặc là trải nghiệm nhập vai mang tính trò chơi, hoặc trở về chức năng xã hội.

Đột phá công nghệ Seedance 2.0: Từ cứng nhắc đến mượt mà, bước nhảy chất lượng

Mô hình video AI mới nhất của ByteDance, Seedance 2.0, xuất hiện một cách âm thầm, và nhà sáng lập kênh công nghệ nổi tiếng “影視颶風” Tim đã đưa ra đánh giá cao trong video mới nhất. Khác với vấn đề vận động máy quay cứng nhắc của các AI trước đây, Tim cho rằng Seedance 2.0 có khả năng xử lý các chuyển động máy quay rộng lớn và mượt mà, đây là một bước đột phá quan trọng trong lĩnh vực tạo video AI.

Các công cụ tạo video AI trước đây như Runway, Pika dù có thể tạo ra hình ảnh, nhưng chuyển động máy quay thường trông máy móc và không tự nhiên. Các vấn đề phổ biến gồm tốc độ di chuyển trục máy đột ngột thay đổi, các động tác rung lắc không mượt, và thiếu cảm giác “hơi thở” của các nhiếp ảnh gia chuyên nghiệp. Những khuyết điểm này khiến các video do AI tạo ra dễ bị nhận biết, không đạt tiêu chuẩn của sản xuất phim chuyên nghiệp. Đột phá của Seedance 2.0 nằm ở khả năng mô phỏng logic vận động của nhiếp ảnh gia thực thụ, bao gồm các đường cong giảm tốc tăng tốc mềm mại, chuyển tiếp tự nhiên khi theo tiêu điểm, và cân nhắc về thẩm mỹ trong bố cục.

Khả năng phân cảnh của Seedance 2.0 còn mang tính cách mạng hơn nữa. Tim chỉ ra rằng AI thể hiện ý đồ logic của đạo diễn, có thể chuyển đổi góc nhìn để phù hợp với mạch truyện và duy trì tính nhất quán của nhân vật. Trong sản xuất phim truyền thống, phân cảnh là công việc cốt lõi của đạo diễn và người quay phim, cần xem xét nhịp điệu kể chuyện, truyền tải cảm xúc và sự liên kết hình ảnh. Seedance 2.0 có thể hiểu logic của kịch bản, tự động thiết kế các chuyển cảnh hợp lý, điều này có nghĩa là AI đã tiến từ công cụ tạo hình ảnh đơn thuần trở thành trợ lý sáng tạo có tư duy đạo diễn.

Tiến bộ về độ phù hợp giữa âm thanh và hình ảnh cũng rất ấn tượng. Seedance 2.0 có thể tạo ra một lần các âm thanh giọng nói tự nhiên và âm môi trường pha trộn, rút ngắn đáng kể quy trình hậu kỳ âm thanh. Trong sản xuất phim truyền thống, thiết kế âm thanh là công đoạn đòi hỏi chuyên môn cao và tốn thời gian. Một cảnh dài hai phút, các kỹ sư âm thanh chuyên nghiệp có thể mất hàng ngày để xử lý làm sạch thoại, thu thập âm môi trường, tạo hiệu ứng âm thanh và trộn âm. Seedance 2.0 rút ngắn quy trình này chỉ còn vài phút, hiệu quả tăng hơn nghìn lần.

Ba đột phá công nghệ của Seedance 2.0

Vận động mượt mà: Mô phỏng đường cong giảm tốc và logic bố cục của nhiếp ảnh gia thực thụ, chấm dứt cảm giác cứng nhắc của AI

Phân cảnh như đạo diễn: Hiểu logic kể chuyện, tự thiết kế chuyển cảnh, duy trì tính nhất quán của nhân vật

Một lần tạo âm thanh: Tự động sinh ra giọng nói và âm môi trường pha trộn, đơn giản hóa quy trình hậu kỳ

Về mặt công nghệ, những đột phá này có thể bắt nguồn từ dữ liệu huấn luyện quy mô lớn hơn và các mô hình thời gian tiến tiến hơn. Seedance 2.0 có khả năng sử dụng biến thể của kiến trúc Transformer, kết hợp mô hình khuếch tán (diffusion) và mạng đối lập sinh (GAN), và được huấn luyện trên hàng loạt tác phẩm điện ảnh chuyên nghiệp. TikTok và Douyin của ByteDance sở hữu kho dữ liệu video ngắn lớn nhất thế giới, cung cấp nguồn dữ liệu huấn luyện vô song cho Seedance 2.0.

Sao chép kỹ thuật số không phép: Vấn đề bản quyền và đạo đức như hộp Pandora

Dù công nghệ Seedance 2.0 mạnh mẽ, “影視颶風” cũng phát hiện ra những rủi ro tiềm ẩn trong quá trình thử nghiệm. Tim phát hiện rằng, chỉ cần tải lên hình ảnh của chính mình mà không cung cấp file âm thanh, mô hình vẫn có thể nhận diện danh tính của ông và tự động ghép giọng nói của ông vào. Thậm chí, sau khi tải lên hình ảnh mặt tiền của tòa nhà “影視颶風”, AI còn có thể chính xác tính toán ra các chi tiết phía sau của tòa nhà nằm trong góc chết của máy quay.

Tim cho biết ông chưa từng nhận được phí bản quyền từ ByteDance, cũng chưa từng bị liên hệ để xin phép. Điều này cho thấy Seedance 2.0 có thể đã sử dụng một lượng lớn dữ liệu hình ảnh và âm thanh của các nhà sáng tạo nội dung điện ảnh mà không có sự thông báo. Hành động này gây ra tranh cãi lớn về quyền sở hữu trí tuệ. Trong hầu hết các khu vực pháp lý, quyền hình ảnh và quyền âm thanh của cá nhân đều được pháp luật bảo vệ, việc sử dụng dữ liệu hình ảnh và âm thanh của người khác để huấn luyện thương mại mà không có sự cho phép có thể vi phạm quyền sở hữu trí tuệ.

Tim lo ngại rằng, nếu AI nắm giữ toàn bộ dữ liệu âm thanh hình ảnh của cá nhân, nó có thể mô phỏng hoàn hảo các bản sao kỹ thuật số khó phân biệt thật giả, thậm chí đến mức người thân gần gũi nhất cũng khó phân biệt thật giả, gây ra tranh cãi về quyền sở hữu và các rủi ro đạo đức lớn. Lo ngại này không phải là vô căn cứ. Với sự phát triển của công nghệ Deepfake, đã xuất hiện nhiều vụ lừa đảo sử dụng AI tổng hợp hình ảnh người nổi tiếng. Nếu Seedance 2.0 bị lạm dụng, có thể dẫn đến các hậu quả nghiêm trọng như chiếm đoạt danh tính, tạo tin giả và lừa đảo tài chính.

Vấn đề đạo đức sâu xa hơn là tính minh bạch của dữ liệu huấn luyện. ByteDance chưa từng công khai nguồn dữ liệu huấn luyện của Seedance 2.0. Nếu mô hình thực sự sử dụng nội dung của các nhà sáng tạo video công khai, các nhà sáng tạo đó có biết không? Có đồng ý không? Có nên được đền bù không? Những câu hỏi này vẫn chưa có khung pháp lý rõ ràng trên toàn cầu. Luật AI của EU và nhiều đề xuất của Mỹ đang cố gắng xây dựng các quy định liên quan, nhưng hiệu quả thực thi và tác động vẫn còn bỏ ngỏ.

Về mặt ngành công nghiệp, nếu Seedance 2.0 có thể sao chép phong cách, giọng nói và ngoại hình của bất kỳ nhà sáng tạo nào mà không cần phép, thì hệ giá trị sáng tạo sẽ sụp đổ hoàn toàn. Các nhà sáng tạo đã bỏ ra nhiều năm xây dựng thương hiệu cá nhân và phong cách riêng, giờ chỉ trong vài phút có thể bị AI sao chép hoàn hảo. Điều này không chỉ gây thiệt hại về kinh tế mà còn đe dọa căn bản về danh tính của chính các nhà sáng tạo.

Những gì còn lại cho các nhà làm phim? Trải nghiệm và thân thể không thể thay thế

Tim cho rằng, dù Seedance 2.0 chưa hoàn hảo, phiên bản tiếp theo rất có thể sẽ hoàn toàn thay đổi cục diện ngành. Những cảnh quay từng mất hàng trăm giờ của các đội hiệu ứng đặc biệt giờ chỉ cần vài phút của AI, khiến kỹ năng chuyên môn nhanh chóng bị giảm giá trị. Khi đầu tư nhân lực và hiệu quả sản xuất không thể cạnh tranh với AI, Tim đặt câu hỏi cuối video: AI đang xóa bỏ hàng rào bảo vệ của sản xuất phim truyền thống, nhưng điều đó tốt hay xấu cho con người?

Trong video “AI có thể thay thế tôi, vậy ý nghĩa của tôi là gì?”, “影視颶風” kết luận là “trải nghiệm”. Trải nghiệm đã hình thành nên linh hồn độc nhất vô nhị của mỗi người. Khi bạn nhìn thấy tóc mẹ bạc phơ, bước vào trường cũ, ngửi mùi trong lớp học, lúc đó AI có thể không hiểu hết bạn. Tàu hơi nước quá chậm và ngu ngốc đối với AI, nhưng đối với con người, nó chứa đựng vô số ký ức chia ly và hy vọng gặp lại.

Nhà phê bình nổi tiếng “切片計畫” trên Bilibili, với gần 2 triệu người theo dõi, cho rằng AI có thể có vô hạn dữ liệu, nhưng chỉ con người mới có thân thể yếu ớt, không hoàn hảo, nhưng chính điều đó làm cho chúng ta thật sự tồn tại. Cô chỉ ra rằng, từ nhỏ, con người đã chìm đắm trong hình ảnh, thậm chí chưa kịp sống, trải nghiệm, bối rối hay mất mát, đã bắt đầu học cách thể hiện. Điều này khiến nhiều sáng tạo xuất phát từ hình thức để xây dựng ý nghĩa, và do đó, những hình ảnh này giống như mô phỏng mơ mộng hơn là chính giấc mơ.

Hai con đường phân nhánh của tương lai điện ảnh

Con đường một: Trò chơi hóa cao độ và nhập vai: kể chuyện tương tác do AI thúc đẩy, khán giả trở thành đồng sáng tạo của câu chuyện, mỗi lần xem đều có kết thúc khác nhau

Con đường hai: Quay về chức năng xã hội chân thực: trở về bản chất xã hội cổ xưa nhất, để mọi người tụ họp trước màn hình, cảm nhận thế giới một lần nữa, như tổ tiên quây quần quanh lửa, chia sẻ cảm xúc và ước vọng

Đạo diễn nổi tiếng Lý An từng nói: “Tôi không lo AI sẽ thay thế chúng ta, mà lo rằng suy nghĩ của chúng ta sẽ trở nên AI hóa.” Câu này phản ánh một nỗi lo sâu xa hơn. Tiến bộ công nghệ không đáng sợ, mà đáng sợ là con người mất khả năng tự suy nghĩ độc lập và cảm nhận chân thực trước công nghệ, khiến sáng tạo trở thành sự bắt chước nội dung do AI sinh ra.

Người sáng lập Apple Steve Jobs có thể cung cấp một hướng suy nghĩ khác. Sau khi bộ phim hoạt hình máy tính đầu tiên “Toy Story” ra đời năm 1995, Giám đốc điều hành Pixar lúc đó, Steve Jobs, nói: “Tất cả công nghệ đều phục vụ cho câu chuyện, dành cho những người sáng tạo. Tôi tin rằng trong tương lai, mọi người vẫn sẽ xem ‘Toy Story’ sau 60 năm nữa, không phải vì hiệu ứng máy tính, mà vì câu chuyện về tình bạn.” Lời này vẫn còn nguyên giá trị sau 30 năm. Dù Seedance 2.0 mạnh mẽ đến đâu, cuối cùng cũng chỉ là công cụ, còn điều chạm đến trái tim vẫn là chính câu chuyện.

Xem bản gốc
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)