عندما تبدأ أدوات التحرير في «فهم كلام الناس»: قامت تطبيق剪映 بتحويل إنشاء الفيديو إلى وكيل مهاراتي

مقالة من كتابة: 连冉

إذا أخبرك أحدهم أن تحرير الفيديو يمكن أن يكون سهلاً مثل “تصفح الهاتف”، فغالبًا ستتساءل في ذهنك.

ففي عاداتنا، غالبًا ما يعني التحرير “تعاون يدوي عالي الكثافة بين العين واليد” — إما الجلوس أمام الكمبيوتر، مع استخدام المفاتيح المختصرة باليد اليسرى والفأرة باليد اليمنى؛ أو التحديق في شاشة الهاتف الصغيرة، والبحث في القوائم المتعددة عن الوظائف، مع محاولة سحب المسارات المليمترية بحذر باستخدام الإصبع.

لكن المساعد الذكي AI في تطبيق剪映، يحاول كسر هذا التصور النمطي.

تخيل أنك تستند على كرسي، دون لمس الفأرة، فقط تتحدث إلى هاتفك: “ساعدني في تحرير هذه المقاطع لإنشاء فلوغ، مع موسيقى مرحة.”

حتى عندما تكتشف أن هناك لقطة انتقال فارغة مفقودة، لا تحتاج للخروج من التطبيق للبحث عن صورة، فقط تقول: “أنشئ لي صورة خلفية هنا.”

هذه التجربة “الحديث بدون استخدام اليدين” تجعلنا نشعر، أثناء تحرير الفيديو، أننا نقترب أكثر من Jarvis، المساعد الشخصي المستعد دائمًا في فيلم “الرجل الحديدي”.

على مدار العام، تتغير منطق المنافسة في فيديوهات AI من مجرد “من يخلق أفضل” إلى “من يستطيع عبر Agent تنفيذ مجموعة كاملة من المهام”. لم تعد مجرد توليد المحتوى عائقًا، بل أصبح التركيز على الذكاء الذي يمكنه بشكل عميق السيطرة على سير العمل المهني وتنفيذ الأوامر المعقدة بدقة، هو محور الصناعة الجديد.

أثبتت剪映 AI أولاً أن التفاعل الصوتي/اللغة الطبيعية يمكن أن يسيطر بشكل عميق على سير العمل في البرامج الاحترافية، من خلال إعادة بناء واجهة المستخدم التقليدية (GUI) باستخدام واجهة المستخدم اللغوية (LUI). وفي الوقت نفسه، هناك شيء آخر يحدث: كل الإبداعات تظهر في剪映 في النهاية.

بالنسبة للعديد من المبدعين التقليديين، يعتبر剪映 نقطة النهاية في عملية التحرير؛ أما بالنسبة للمبدعين الجدد باستخدام AI، حتى لو أنجزوا صورًا حية وفيديوهات مباشرة على برامج أخرى، فإنهم يعودون في النهاية إلى剪映 لإجراء التعديلات الدقيقة والربط النهائي.

هذه الظاهرة “الطريق المختلف يؤدي إلى نفس الهدف” أظهرت فرصة “All in One” — ففي سبتمبر من العام الماضي، قامت剪映 بترقية وظيفة تحويل النص إلى فيديو، لتمهد الطريق من “الذكاء الاصطناعي يولد” إلى “التحرير الدقيق”.

هناك العديد من الوكلاء القادرين على التوليد، لكن الوكيل الذي يمكنه “توليد الفيديو + التحرير المهني + تنفيذ المهارات” هو فقط剪映.

وهذا يرجع إلى قدرات النماذج الكبيرة المتقدمة، بالإضافة إلى تراكم سنوات من الوظائف الضخمة ومحرك التحرير الأساسي. فهذه الأدوات العميقة هي التي تدعم وجود “شريك إبداعي AI شامل” قادر على فهم الكلام، وتنفيذ مهام تحرير معقدة باستخدام مهارات متعددة بشكل متناسق.

من خلال إزالة الحواجز التقنية الناتجة عن “مهارة الأدوات”، يعيد剪映 المنافسة على المحتوى إلى جوهر “القصة” و"الإبداع".

من “التعاون بين اليد والعين” إلى “الابتكار المشترك بين الإنسان والآلة”

عندما تسافر وتريد تصوير فلوغ، وتلتقط مشاهد جميلة بشكل عشوائي، وعند انتهاء الرحلة وفتح الألبوم — تشعر بالدوار.

هذه الصورة الحقيقية لكل شخص يحرص على توثيق حياته. إفراز الدوبامين أثناء التصوير، يتحول فجأة إلى عبء نفسي كبير عند مواجهة مئات الفيديوهات المجزأة، والأصوات الخلفية المشتتة، والصور غير المتناسقة. كانت الذكريات الجميلة التي أردت توثيقها، تتحول إلى “ديون تحرير” ثقيلة.

هذه الظاهرة “تراكم المواد في الألبوم” تعكس بشكل أساسي أن سير عمل تحرير الفيديو التقليدي يواجه حاجزًا كبيرًا يثبط العزيمة.

طوال الوقت، لم يكن تحرير الفيديو مجرد اختبار جمالي، بل استهلاك للجهد البدني أيضًا. حتى لو أردت فقط تجميع هذه المواد السياحية في سجل بسيط، عليك المرور بعمليات التصفية، والتقطيع، وضبط الإيقاع، وتعديل الألوان، وغيرها من الأعمال الميكانيكية. هذه الأعمال ذات العتبة العالية والمتكررة، تمنع الكثيرين من التعبير عن أنفسهم.

في إطار منطق التحرير غير الخطي (NLE)، يُستهلك الكثير من جهد المبدع في مراحل غير إبداعية — البحث عن وظائف في القوائم المتعددة، التجربة والخطأ في لوحات الإعداد المعقدة، أو تنظيف المواد المملة.

وفي ذلك الصندوق الأسود المسمى “التحرير”، تملأه النقرات المملة على الفأرة وسحب الأصابع. وكلما اقترب الأمر من التحكم الدقيق في تدفق الفيديو، يظل المبدع عاجزًا عن تجاوز متاهة المسارات والمعلمات المعقدة.

انظر إلى “مصباح الإضاءة الصغيرة”، حيث يمكنك رؤية العديد من وظائف مساعد剪映 AI|المصدر: 极客公园

هذه المشاكل تتطلب ظهور نمط جديد.

المحور الرئيسي لمساعد剪映 AI هو إعادة هيكلة طريقة التفاعل، لكسر الحواجز المهنية المعقدة. لم يعد مجرد وظيفة مساعدة مضافة، بل أدخل وكيلًا (Agent) يرفع مستوى التفاعل من “الواجهة الرسومية (GUI)” إلى “الحوار الطبيعي (LUI)”، مع توظيف مكتبة مهارات التحرير التي تمثل أحدث تقنيات الصناعة.

إنه مثل “مركز تحرير مهاري” يفهم التقنية، يسمح للمستخدمين بتجاوز تعلم منطق تشغيل البرامج، والتواصل عبر الصوت أو النص، لاستدعاء قدرات تحرير متعددة المسارات بشكل مباشر.

وقد جرب极客公园 هذا المفهوم، حيث قال أحدهم:

"دع剪映 AI يساعدني في تحرير مواد رحلتي العام الماضي (الفيديو يتضمن تسريعًا، والانتظار الفعلي حوالي خمسين ثانية)"|المصدر: 极客公园

كما ترى، أنا فقط قلت: “ساعدني في تحويل هذه المواد إلى فلوغ”، فساعدني剪映 AI في إتمام مهمة اختيار الموسيقى، والانتقالات الذكية، وإنتاج فيديو كامل. وإذا أردت تغيير الموسيقى إلى نمط أكثر مرحًا، فقط أخبره، وسيقوم بالتغيير مباشرة.

هذه العمليات التي كانت تستغرق وقتًا وجهدًا كبيرًا، أصبحت الآن مجرد أمر بسيط. فقط أُعطي الأمر، ويقوم剪映 AI بدقة بتحديد النية، وتنسيق المهارات الأساسية، وإنجاز المهام التي كانت تتطلب دقائق في السابق.

حتى ربط المشاهد بسلاسة (الفيديو يتضمن تسريعًا، والانتظار حوالي عشرين ثانية)|المصدر: 极客公园

وليس فقط تحرير الفيديو، بل حتى إضافة النصوص أصبح أسهل. فحتى في فيديو القطة، أخبر剪映 AI فقط بكلمة “نص داخلي عن القطة”، فأنشأ لي ذلك تلقائيًا.

إطلاق剪映 AI يعني أن برامج التحرير تتجه من “عرض الوظائف” إلى “فهم النية + تنفيذ المهارات”. خارج وظائف الإدخال، يربط أيضًا “المركز العصبي” لمكتبة الأدوات الضخمة، ليعيد المنافسة على المحتوى إلى جوهر القصة والإبداع.

كيف تتولى الوكيل المهاري (Skill化 Agent) “الأعمال القذرة”؟

معظم منتجات AI في السوق تتجه نحو تنفيذ المهام، و剪映 AI هو وكيل متخصص قادر على تنفيذ المهام بدقة، ويغطي جميع المهارات في سيناريوهات التحرير، ويركز على حل المشكلات الحقيقية في عمليات التحرير.

ما هو الوكيل المهني؟ هو الذي يساعدك عندما “لا تعرف كيف تفعل”، ويقوم بـ"التفكير" نيابة عنك، أو عندما “تتعب” من العمل، ويقوم بـ"العمل" نيابة عنك، باستخدام مهارات موحدة لتنفيذ جميع العمليات المملة بضغطة زر.

في عملية التحرير، هناك سيناريوهان نفسيان للمستخدم:

الأول هو “أنا أعرف كيف أفعل، لكني متعب”، وهو حاجة إلى كفاءة عالية عند التعامل مع العمليات المملة.

مثلاً، بعد تصوير مجموعة من المواد، تعرف أنك بحاجة إلى تقصيرها، وإزالة الضوضاء، وتعديل الألوان، لكن مجرد التفكير في النقر مئات المرات على الهاتف يدفعك للتخلي. هنا، يكون المساعد AI هو المنفذ الذي لا يكل. فقط أُعطيه الأمر، وهو يتولى تلك العمليات الجماعية المملة التي لا تتطلب إبداعًا.

الثاني هو “أنا لا أعرف كيف، ساعدني في التفكير”، وهو حاجة إلى إلهام عند مواجهة طلبات غامضة. ربما تريد انتقالات “متقدمة” أو “فلتر مناسب للخريف”، لكنك لا تعرف بالضبط أي وظيفة تستخدم. في هذه الحالة، يتحول المساعد AI إلى مدير إبداعي يلهمك، ويفهم أوامرك الغامضة، ويستدعي المهارة المناسبة لإنجاز الفكرة.

وفي الوقت نفسه، يطابق剪映 AI بدقة احتياجات ثلاثة أنواع من المبدعين: محترفو التحرير: يستخدمون مهارات التحرير الجماعي، لمعالجة مواد متعددة المسارات بسرعة؛ المبتدئون: يستخدمون أوامر غامضة لتفعيل مهارات أساسية، بسرعة تحديد الوظائف وإتمام العمليات؛ المبتدئون جدًا: يعتمدون على مهارات التوليد، بدون أفكار أو عمليات، لإنتاج الفيديو بضغطة زر.

المصدر: 极客公园

كما ترى، فقط بكلمة واحدة، يقوم剪映 AI بكفاءة بحذف “أم، آه، يعني” من النص، ويعمل مباشرة على المسودة، مع وضوح نقاط التحرير، وقابلية التعديل في أي وقت. هذه هي قوة LUI (التفاعل اللغوي): إعادة التركيز على الإبداع، وترك الأعمال المملة للمساعد AI الشامل.

لكن، لكي يتطور AI من “فهم” حديث عادي إلى “تنفيذ” دقيق لأوامر تحرير معقدة، يتطلب الأمر إعادة هيكلة عميقة في تقنية التفاعل.

أولاً، يجب أن يكون قادرًا على تفكيك الطلبات مثل “المدير العام”، وتنسيق المهارات المتعددة. مع وجود مكتبة أدوات ضخمة، يتطلب الأمر قدرات عالية على التعرف على النية وتوزيع المهام.

وهذا يعتمد على تقنية إدارة متعددة الوكلاء (Multi-Agent) وتنسيق المهارات (Skill化) — يمكن تصورها كفريق عمل فعال. عند إصدار أمر، يفهم القائد (الوكيل الرئيسي) بسرعة النية، ثم يوزع المهام على “خبراء” متخصصين في التحرير، الموسيقى، التلوين، وغيرها، ويستدعي المهارات المناسبة بدقة. من خلال هذا التعاون، يمكن للذكاء الاصطناعي أن يترجم عبارة “اجعل الفيديو أكثر إشراقًا” إلى إعدادات سطوع محددة على المسارات.

ثانيًا، يجب أن يكون قادرًا على العمل مباشرة على “طاولة العمل”، مع دعم التعديلات الديناميكية. على عكس النماذج التي تنتج فيديو نهائي غير قابل للتعديل، فإن突破剪映 AI يكمن في بروتوكول المسودات الديناميكي. ببساطة، AI لا يرسل لك فيديو جاهزًا غير قابل للتغيير، بل يتفاعل مباشرة على مسارات التحرير الخاصة بك.

وبالدمج مع قدرات التعاون بين السحابة والعميل، يتم تحديث كل خطوة في الوقت الحقيقي، مع شفافية كاملة، لتحقيق التعاون بين الإنسان والآلة.

وأخيرًا، يمتلك القدرة على “التفكير” و"الاستفهام" مثل الإنسان.

الوكيل المهني الحقيقي، عند عدم فهم الطلب، يطرح أسئلة تأكيدية. وإذا كانت الأوامر غامضة أو فشل التنفيذ، لا يفرض عملًا عشوائيًا، بل يطلق آلية “الاستفهام” و"التفكير"، ليؤكد الحاجة بشكل مشابه لمساعد حقيقي. هذه القدرة على التصحيح الذاتي تقلل بشكل كبير من عتبة التواصل.

كما ترى، أصبح剪映 AI مساعدًا مركزيًا في تنفيذ المهارات، يركز على سيناريوهات التحرير. للمحترفين، هو مضاعف كفاءة معالجة المواد الجماعية؛ وللأشخاص المبتدئين، هو مصدر إلهام دائم.

وقد أثبت أن قيمة الوكيل في سير العمل المهني ليست فقط في توليد المحتوى، بل في السيطرة على الأعمال المملة “العمل القذر”، وإعادة السيطرة على الإبداع للمبدع.

“اللغة هي الأمر”

في السابق، كانت مسارات AI للفيديو تركز بشكل كبير على “الخلق من لا شيء”، لكن بالنسبة للإنتاج الاحترافي عالي الجودة، فإن النهاية ليست سوى بداية العمل.

على الرغم من أن الذكاء الاصطناعي التوليدي حل مشكلة مصدر المواد، إلا أنه يفتقر إلى تلبية الاحتياجات المهنية في السرد، والإيقاع، والتعديل الدقيق للصور.

وعلى مدى فترة طويلة، كانت هناك فجوة في الصناعة: إما نماذج توليد “صندوق غامض” لا يمكن تعديلها، أو أدوات تقليدية تفتقر إلى الذكاء.

بحلول 2025-2026، تخلت الصناعة عن وهم “الذكاء الاصطناعي الشامل”، وأصبحت المهارات المتخصصة (Skill化 Agent) هي الاتجاه الرئيسي للأدوات المهنية. ظهور剪映 AI ساهم في سد هذه الفجوة، حيث حلّ المشاكل السابقة، ورفع مستوى المبدعين من مجرد “مشغل انتقالات” و"متحكم في التوقيت" إلى “مخرج يوجه ويشرف على الجمالية”.

وهذا يعكس بشكل قوي فلسفة العلامة التجارية “كل شيء في AI، وكل شيء في واحد”.

رغم أنه لا يزال في مراحله المبكرة، ولا يمكنه بعد استبدال المبدع في إخراج أفلام أوسكار، إلا أنه يعكس اتجاهًا مستقبليًا — حيث قد تتخلى برامج التحرير عن الواجهات المعقدة، ويحل محلها نمط الحوار + استدعاء المهارات، الذي سيحل تدريجيًا محل العمليات التقليدية GUI.

يقدم剪映 AI المساعد، مع التركيز على التفاعل الصوتي، خفض عتبة التحرير إلى الصفر، بحيث يمكنك إنجاز ما لا تعرفه أو تمل من فعله، فقط بتحريك لسانك. من “تعلم التحرير، والبحث عن الوظائف” إلى “التعبير عن الطلب، وانتظار النتيجة”، لن يظل المبدع مقيدًا بالأدوات، بل ستعود القوة الأساسية إلى “الإبداع” نفسه، وسيصبح الجميع مخرج فيديو لحياته.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت