
أطلقت شركة ByteDance نموذج الفيديو الذكي Seedance 2.0، والذي حقق اختراقات كبيرة في تقنيات الحركة، وتخطيط المشاهد، والصوت والصورة، وفقًا لتقييم مؤسس قناة “عاصفة السينما” تيم. ومع ذلك، اكتشف تيم أن النموذج قام تلقائيًا وبغير إذن بدمج صوته، ولم يتلقَ أبدًا مقابل ذلك أي رسوم ترخيص. وتخشى “عاصفة السينما” من أن الذكاء الاصطناعي يمكن أن يُحاكي بشكل مثالي بدائل رقمية يصعب التمييز بين حقيقتها وزيفها. ويتوقع مشروع “قطعة” أن تتجه صناعة الأفلام إلى مسارين متباينين: إما غمر الجمهور في تجارب تفاعلية وألعابية، أو العودة إلى الوظائف الاجتماعية التقليدية.
ظهر نموذج الفيديو الذكي الأحدث من ByteDance، Seedance 2.0، بشكل متواض، وحصل على تقييمات عالية من قبل تيم، مؤسس قناة “عاصفة السينما”. على عكس المشكلات السابقة التي كانت تتعلق بصلابة حركات الكاميرا، يرى تيم أن Seedance 2.0 قادر على معالجة حركات كاميرا واسعة النطاق بسلاسة، وهو إنجاز مهم في مجال توليد الفيديو بواسطة الذكاء الاصطناعي.
كانت أدوات توليد الفيديو السابقة مثل Runway و Pika، رغم قدرتها على إنتاج الصور، إلا أن حركات الكاميرا كانت غالبًا تبدو آلية وغير طبيعية. من المشكلات الشائعة تغير سرعة التتبع فجأة، وعدم سلاسة حركات الاهتزاز، وغياب “تنفس” المصور المحترف. هذه العيوب كانت تجعل من السهل تمييز الفيديوهات التي أنتجها الذكاء الاصطناعي، مما يمنعها من الوصول لمعايير الإنتاج السينمائي الاحترافي. أما الاختراق في Seedance 2.0، فهو قدرته على محاكاة منطق حركة المصور الحقيقي، بما يشمل منحنيات التباطؤ والتسريع الطبيعية، والانتقالات السلسة في التركيز، والجماليات في التكوين.
أما تحسين قدرات تخطيط المشاهد، فهو أكثر ثورية. أشار تيم إلى أن الذكاء الاصطناعي يظهر نية إبداعية تشبه المخرج، حيث يمكنه تغيير وجهة النظر بشكل منطقي للحكي، مع الحفاظ على اتساق الشخصيات. في الإنتاج السينمائي التقليدي، يُعد تخطيط المشاهد مهمة أساسية للمخرج ومدير التصوير، يتطلب مراعاة إيقاع السرد، ونقل المشاعر، والحفاظ على تماسك الصورة. يستطيع Seedance 2.0 فهم منطق النص، وتصميم انتقالات الكاميرا بشكل تلقائي، مما يعني أن الذكاء الاصطناعي قد تطور من مجرد أداة لإنشاء الصور إلى مساعد إبداعي يمتلك تفكير المخرج.
كما أن التوافق بين الصورة والصوت شهد تقدمًا مذهلاً. يمكن لـ Seedance 2.0 إنتاج همسات صوتية طبيعية ودمجها مع الموسيقى والبيئة الصوتية بضغطة زر، مما يقلل بشكل كبير من الوقت المستغرق في عمليات المونتاج الصوتي. في عمليات ما بعد الإنتاج التقليدية، يتطلب تصميم الصوت خبرة ووقتًا كبيرًا. على سبيل المثال، مشهد مدته دقيقتان قد يستغرق أيامًا لتنظيف الحوار، وجمع الأصوات البيئية، وإنتاج المؤثرات الصوتية، وضبط المونتاج. أما Seedance 2.0، فيختصر كل ذلك إلى دقائق، مع زيادة في الكفاءة بأكثر من ألف مرة.
حركة سلسة: محاكاة منحنيات التباطؤ والمنطق التكويني للمصور الحقيقي، والتخلص من الصلابة في الحركة
تخطيط مشاهد بمستوى المخرج: فهم منطق السرد وتصميم انتقالات الكاميرا تلقائيًا، مع الحفاظ على اتساق الشخصيات
صوت واحد بضغطة: توليد صوت بشري ودمجه مع البيئة الصوتية تلقائيًا، لتبسيط عمليات المونتاج النهائي
من الناحية التقنية، قد تكون هذه الاختراقات ناتجة عن تدريب على مجموعات بيانات أكبر، ونماذج زمنية أكثر تقدمًا. من المحتمل أن Seedance 2.0 يستخدم نسخة من بنية Transformer، مع دمج نماذج الانتشار (Diffusion) وGAN (الشبكات التوليدية التنافسية)، ويتم تدريبه على كميات هائلة من الأعمال السينمائية والتلفزيونية الاحترافية. تمتلك ByteDance، من خلال TikTok و Douyin، أكبر قاعدة بيانات لمقاطع الفيديو القصيرة على مستوى العالم، مما يمنح Seedance 2.0 موارد تدريب لا مثيل لها.
على الرغم من قوة تقنية Seedance 2.0، كشفت “عاصفة السينما” خلال الاختبارات عن مخاطر محتملة. اكتشف تيم أنه، حتى عند رفع صورته فقط دون تسجيل صوت، يمكن للنموذج التعرف على هويته تلقائيًا وإضافة صوته دون إذن. والأكثر إثارة للدهشة، أنه بعد رفع صورة لواجهة مبنى “عاصفة السينما”، استطاع الذكاء الاصطناعي بدقة حساب تفاصيل خلفية المبنى من الزوايا الميتة في الصورة.
قال تيم إنه لم يتلقَ أبدًا رسوم ترخيص من ByteDance، ولم يتم التواصل معه بشأن ذلك. وهذا يشير إلى أن Seedance 2.0 ربما يستخدم بشكل غير معلن كميات هائلة من بيانات الفيديو والصوت الخاصة بصانعي المحتوى، من دون إذن منهم. يثير هذا الأمر جدلاً واسعًا حول حقوق الملكية الفكرية والأخلاق. في معظم الأنظمة القضائية، يُحمي قانون الصورة والصوت حقوق الأفراد، وأي استخدام غير مرخص لبياناتهم الصوتية والمرئية لأغراض تجارية قد يُعد انتهاكًا قانونيًا.
يخشى تيم أن امتلاك الذكاء الاصطناعي لبيانات شخصية كاملة يمكن أن يُمكّنه من إنشاء بدائل رقمية يصعب التمييز بينها وبين الواقع، مما يهدد بحدوث حالات من التزييف العميق (Deepfake) التي يمكن أن تُستخدم في الاحتيال، أو نشر الأخبار المزيفة، أو سرقة الهوية، أو الاحتيال المالي. هذه المخاطر ليست خيالية، فمع تطور تقنيات التزييف العميق، ظهرت حالات عديدة لاستخدام AI في تزوير مقاطع فيديو لمشاهير بهدف الاحتيال.
أما المشكلة الأخلاقية الأعمق فهي غموض مصادر البيانات المستخدمة في تدريب النماذج. لم تكشف ByteDance عن مصادر البيانات التي استُخدمت في تدريب Seedance 2.0، فهل كانت تعتمد على محتوى منشئي المحتوى بشكل غير معلن؟ هل تم الحصول على موافقتهم؟ وهل يجب تعويضهم؟ هذه الأسئلة تفتقر إلى أطر قانونية واضحة على مستوى العالم. تسعى قوانين الاتحاد الأوروبي للذكاء الاصطناعي ومبادرات أمريكية عديدة إلى وضع تنظيمات، لكن التنفيذ والتأثير الفعلي لا يزالان قيد الاختبار.
من منظور الصناعة، إذا استطاع Seedance 2.0 أن ينسخ أساليب، أصوات، وملامح أي مبدع دون إذنه، فإن قيمة الإبداع ستنهار تمامًا. فالمبدعون الذين استثمروا سنوات لبناء علاماتهم الشخصية وأسلوبهم الفريد قد يُنسخون خلال دقائق بواسطة الذكاء الاصطناعي. وهذا تهديد جوهري ليس فقط للاقتصاد، بل لهوية المبدع ذاته.
يعتقد تيم أن، رغم أن Seedance 2.0 لم يصل بعد إلى الكمال، فإن الإصدار القادم قد يغير المشهد تمامًا. فمشاهد كانت تتطلب مئات الساعات من فريق المؤثرات الخاصة لإنشائها، يمكن الآن أن تُنتج خلال دقائق بواسطة AI، مما يقلل من قيمة المهارات الاحترافية بسرعة. وعندما يصبح المدخل البشري والإنتاجية غير قادرين على المنافسة مع الذكاء الاصطناعي، يتساءل تيم في نهاية الفيديو: هل ينهار الحصن المنيع لصناعة السينما التقليدية، أم أن هناك شيئًا لا يمكن للذكاء الاصطناعي أن يحل محله؟
وفي فيديو “هل يمكن للذكاء الاصطناعي أن يحل محلي؟” يخلص تيم إلى أن “الخبرة” هي ما يبقى. فالتجربة تصنع روح كل إنسان فريدة، وعندما ترى شعر والدتك الأبيض، أو تدخل المدرسة القديمة، أو تشم رائحة الفصل، فإن الذكاء الاصطناعي قد يعجز عن فهم ذلك. فالسكة الحديدية البطيئة بالنسبة للذكاء الاصطناعي، إلا أنها تحمل ذكريات الفراق والأمل في اللقاء مجددًا، التي لا يمكن أن تتكرر.
أما الناقد السينمائي المعروف على Bilibili، “قطعة”، الذي لديه قرابة 2 مليون متابع، فيرى أن الذكاء الاصطناعي قد يمتلك كمًا هائلًا من البيانات، لكن الإنسان هو الوحيد الذي يمتلك الجسد الحقيقي، الضعيف، غير المثالي، لكنه الحقيقي. وأكدت أن الإنسان منذ طفولته غارق في الصور، قبل أن يعيش ويختبر ويشعر ويُحبط، بدأ يتعلم كيف يعبر عن نفسه. لذلك، فإن الكثير من الإبداعات تأتي من محاولة بناء معنى من الشكل، وتبدو هذه الصور أشبه بمحاكاة للأحلام أكثر من الأحلام ذاتها.
الطريق الأول: ترفيه تفاعلي وغامر عالي التقنية: سرد قصصي تفاعلي يقوده الذكاء الاصطناعي، حيث يصبح المشاهد مشاركًا في صناعة القصة، مع نهايات مختلفة في كل مشاهدة
الطريق الثاني: العودة إلى الوظائف الاجتماعية الأصلية: استعادة الطابع الاجتماعي الأصيل، حيث يجتمع الناس أمام الشاشة ليشعروا بالعالم من جديد، كما كان أجدادهم يحيطون بالنار ويشاركون الأحلام والمشاعر
قال المخرج العالمي لي آن: “لست قلقًا من أن يحل الذكاء الاصطناعي محلنا، بل أخشى أن تتغير أفكارنا إلى شكل يشبه الذكاء الاصطناعي.” تعكس هذه المقولة قلقًا أعمق. فالتقدم التكنولوجي ليس مخيفًا بحد ذاته، بل المخيف هو أن يفقد الإنسان قدرته على التفكير المستقل والشعور الحقيقي، وأن يتحول الإبداع إلى مجرد تقليد لمحتوى يُنتجه الذكاء الاصطناعي.
وفي حديثه قبل وفاته، قال ستيف جوبز، مؤسس أبل، بعد إصدار أول فيلم رسوم متحركة كامل الكمبيوتر عام 1995: “كل التكنولوجيا تخدم القصّة، وتُستخدم من قبل المبدعين. أؤمن أن الناس سيشاهدون ‘توي ستوري’ بعد 60 عامًا، ليس بسبب المؤثرات الرقمية، بل لأنها قصة عن الصداقة.” وما زالت هذه الحكمة صالحة حتى اليوم، بعد 30 عامًا. فمهما كانت قوة Seedance 2.0، فهي أداة، والقصّة الحقيقية التي تلامس القلب تظل دائمًا في جوهرها.