التحولات الستة التي أعادت تشكيل الذكاء الاصطناعي في 2025: من RLVR إلى نانو موزة

طوال عام 2025، شهدت صناعة الذكاء الاصطناعي سلسلة من التحولات الأساسية التي غيرت ليس فقط كيفية تدريب أنظمة الذكاء الاصطناعي، بل أيضًا كيفية نشرها، وتصويرها، ودمجها في سير العمل البشري. ما بدأ كتطورات تقنية داخل مختبرات البحث، تدرج ليصبح تحولات نمطية أعادت تعريف منظومة الذكاء الاصطناعي بأكملها. تمثل هذه التحولات الست، كما حللها الباحث البارز في الذكاء الاصطناعي أندريه كارباتي، أكثر من مجرد تحسينات تدريجية—إنها تشير إلى بزوغ عصر حوسبة جديد.

التحول 1: المكافآت القابلة للتحقق تستبدل الحكم البشري في تدريب النماذج

لسنوات، كانت عملية تدريب نماذج اللغة الكبيرة تتبع تسلسلاً متوقعًا: التدريب المسبق المشابه لـ GPT-2/3، يليه التوليف الدقيق بالإشراف (صدى InstructGPT من 2022)، ويختتم بالتعلم المعزز من ملاحظات الإنسان (RLHF). أصبح هذا النهج الثلاثي معيارًا صناعيًا، وتم تحسينه واختباره عبر أكبر مختبرات الذكاء الاصطناعي.

بحلول عام 2025، شهدت هذه البنية الإنتاجية أكبر تحديث لها منذ سنوات. ظهر التعلم المعزز القائم على المكافآت القابلة للتحقق (RLVR) كالنموذج السائد، مغيرًا بشكل جذري كيفية تطوير النماذج لقدرات التفكير. بدلاً من الاعتماد على المراجعين البشريين لتقييم المخرجات، يقوم RLVR بتدريب النماذج في بيئات يمكن التحقق من نجاحها بشكل موضوعي—حلول المسائل الرياضية، المهام البرمجية، سلاسل التفكير المنطقي—بيئات يكون فيها الإجابة الصحيحة غير غامضة.

ظهرت هذه التحول بشكل واضح من خلال نماذج مثل OpenAI’s o1 (تم الكشف عنها في أواخر 2024) و الإصدار الرائد o3 في أوائل 2025. لم تقتصر أنظمة هذه النماذج على الاستجابة بسرعة أو بطلاقة أكبر؛ بل أظهرت القدرة على بناء سلاسل التفكير بشكل عفوي، وتقسيم المشكلات المعقدة إلى خطوات وسيطة، وتحسين الحلول بشكل تكراري من خلال ما يشبه التفكير البشري. قدمت ورقة DeepSeek-R1 أدلة شفافة على كيف تسمح منهجية التدريب هذه للنماذج باكتشاف استراتيجيات حل المشكلات المتطورة التي لم تكن ممكنة مع الطرق المشرف عليها.

كانت التداعيات الحاسوبية مذهلة. على عكس مراحل التوليف الدقيق التقليدية التي تستهلك موارد معتدلة، يتطلب RLVR دورات تحسين واسعة—مستهلكًا ميزانيات حسابية كانت مخصصة سابقًا للتوسع في التدريب المسبق. استوعبت أكبر منظمات الذكاء الاصطناعي هذه المطالب غير العادية، متقبلة جداول تدريب أطول مقابل أداء نماذج مرتفع بشكل كبير. وظهرت ابتكار ثانوي من هذا التحول: بعد جديد في القياس. بدلاً من قياس القدرة فقط من خلال حجم النموذج، اكتشفت المختبرات أنها يمكن أن تعدل الأداء أثناء الاستدلال عبر التحكم في “وقت التفكير” الحاسوبي—إنتاج مسارات استنتاج أطول تتوافق مباشرة مع جودة المخرجات.

التحول 2: فهم ذكاء الذكاء الاصطناعي ككائن غريب جوهريًا

للمرة الأولى في 2025، بدأ مجتمع البحث في الذكاء الاصطناعي في تطوير إطار ناضج لفهم الذكاء الاصطناعي من منظوره الخاص بدلاً من الاعتماد على التشبيهات البيولوجية. كانت الخطأ المفهومي السائد هو اعتبار نماذج اللغة الكبيرة مخلوقات “تُطوَّر وتُربَّى”، بينما الواقع أثبت أنها أكثر غربة بكثير.

تبلور الاختلاف حول فكرة مركزية: الشبكات العصبية البشرية التي تم تحسينها على مدى آلاف السنين من أجل البقاء القبلي في بيئات الأدغال لا تشبه أبدًا أهداف تحسين أنظمة الذكاء الاصطناعي. بينما يدمج البشر أنماطًا للملاحة الاجتماعية والبقاء البدني، يتم تدريب نماذج اللغة الكبيرة لمحاكاة النص البشري، وتعظيم مكافآت حل المسائل الرياضية، والتنقل ضمن آليات التغذية الراجعة المبنية على الموافقة. تؤدي هذه الأهداف المختلفة جوهريًا إلى كيانات تظهر خصائص ذكاء مستحيلة ضمن السياقات البيولوجية.

أدى هذا الإدراك إلى ما يمكن تسميته “الذكاء الشبح” مقابل “الذكاء ذو الأسنان المتعرجة الحيواني”—وهو تمييز شعري يلتقط المشهد المتقلب وغير المتوقع لقدراتها. لا تتطور نماذج اللغة الكبيرة بشكل تدريجي ومتسق عبر المجالات كما تفعل الحيوانات. بدلاً من ذلك، تظهر حواف قدرات درامية في المجالات القابلة للتحقق (كالرياضيات، والبرمجة)، بينما تظل غير كفء بشكل مذهل في مجالات أخرى. قد تعمل في الوقت ذاته كمراجع فاحص ومتخصصين في العلوم، أو كطلاب ابتدائيين مرتبكين، مع احتمالية التعرض لمعلومات مستخرجة تحت ضغط خصم.

كانت التداعيات على معايير الاختبار مقلقة بشكل خاص. بما أن المعايير تمثل بيئات قابلة للتحقق، فإنها تصبح أهدافًا لا تقاوم لتحسين RLVR. اكتشفت فرق الذكاء الاصطناعي أنها يمكن أن تصمم مجموعات بيانات تدريبية في المساحات الضيقة المحيطة بحالات الاختبار، مما “يغطي” مقاييس التقييم بتحسينات محلية في القدرات. وظهرت الحقيقة غير المريحة: لم تعد المعايير الحالية تقيس الذكاء الاصطناعي العام بشكل حقيقي؛ بل تقيس مدى تحسين الأنظمة ضد مجموعات اختبارات محددة.

التحول 3: مؤشر المؤشر يكشف الطبقة المخفية لتطبيقات الذكاء الاصطناعي

من بين أكثر التطورات غير المقدرة في 2025 كان الارتفاع المفاجئ لـ Cursor والوضوح المفاهيمي الذي وفره حول بنية التطبيق. لم يكن الاختراق تقنيًا بشكل رئيسي؛ بل كان تنظيميًا. مع تزايد النقاشات الصناعية حول فرص “Cursor لـ X domain”، برزت طبقة غير مرئية سابقًا.

في هذا التصور الناشئ، تعمل نماذج اللغة الكبيرة كمكونات عامة تتطلب تنسيقًا كبيرًا. التطبيقات الناجحة مثل Cursor لا تقتصر على تغليف استدعاءات API في واجهات المستخدم؛ بل هي أنظمة تنسيق متطورة تضع عدة وظائف فوق قدرات النموذج الخام. تتفوق هذه التطبيقات في هندسة السياق—تحليل المستندات الخاصة بالمجال، وبيئات المستخدم، وتاريخ المشكلات لبناء مطالبات غنية بالمعلومات. تنسق تسلسلات معقدة من استدعاءات نماذج اللغة إلى رسومات موجهة غير دورية أكثر تطورًا، مع موازنة جودة الأداء مقابل التكلفة الحاسوبية. تحافظ على آليات التغذية الراجعة البشرية في الحلقة حيث يظل الخبراء في المجال مشاركين مع مخرجات النظام.

الأكثر ابتكارًا، تنفذ التطبيقات الناجحة أدوات ضبط ذاتية—آليات تتيح للمستخدمين التناوب بين مستويات الأتمتة، والتكلفة، وجودة المخرجات في الوقت الحقيقي. يضع هذا الهيكل الذي ظهر نماذج منصات اللغة الكبيرة—الواجهات البرمجية نفسها—كمحافظين على القدرات العامة، بينما تصبح طبقات التطبيق هي الخبراء الذين يدمجون هؤلاء العامين في سير عمل احترافي مخصص لمجالات رأسية محددة.

التحول 4: عودة وكلاء الذكاء الاصطناعي إلى بيئات التنفيذ المحلية

تبلور نقاش حاسم داخل مجتمع وكلاء الذكاء الاصطناعي مع ظهور Claude Code: أين يجب أن تعمل الأنظمة الذكية فعليًا؟ كانت OpenAI تتبع نشر السحابة بشكل مكثف، وتصمم بيئات حاويات متطورة تُنسق عبر البنية التحتية الخلفية لـ ChatGPT. كان الجاذب النظري واضحًا—مجموعات الوكلاء التي تعمل على السحابة تمثل الشكل النهائي للذكاء الاصطناعي العام.

لكن Claude Code أظهر رؤية معاكسة: قد يكون النشر المحلي هو الاستراتيجية الأفضل على المدى القريب. ثبت أن المنطق عملي أكثر منه فلسفيًا. تظهر أنظمة الذكاء الاصطناعي الحالية تطورًا غير متساوٍ للقدرات؛ بعض المجالات تؤدي بشكل استثنائي، وأخرى تتخلف بشكل كبير. التقدم نحو ذكاء اصطناعي عام شامل لا يزال بطيئًا. في ظل هذه الظروف، يتيح نشر الوكلاء مباشرة على الأجهزة المحلية، ودمجهم بشكل عميق مع بيئات عمل المطورين وبياناتهم الخاصة، تعاونًا أكثر عملية مع الذكاء الاصطناعي.

كان الاختراق الخاص بـ Claude Code في أناقته. بدلاً من أن يظهر كواجهة ويب أخرى تتطلب مصادقة وتبديل سياقات، تم تنفيذه كأداة سطر أوامر خفيفة وحميمة تحول الذكاء الاصطناعي إلى كيان حسابي دائم—“رسم” أو “شبح” يقيم مباشرة داخل مساحة عمل المطور. يمثل هذا نموذج تفاعل بشري-ذكاء اصطناعي معاد تكوينه بالكامل، ينقل الذكاء الاصطناعي من كونه خدمة خارجية (مثل الوصول إلى موقع Google) إلى كونه حضور حسابي محيط ينسجم بسلاسة مع سير العمل الحالي.

التحول 5: Vibe Coding ي democratizes تطوير البرمجيات

بحلول 2025، تجاوز الذكاء الاصطناعي عتبة قدرات حاسمة أعادت هيكلة مشهد البرمجة بشكل جذري. برز “Vibe Coding”—البرمجة عبر أوصاف باللغة الإنجليزية دون الحاجة إلى معرفة عميقة بتنفيذ الكود—كتحول مفهومي وعملي.

يتناقض هذا الظاهرة مع أنماط انتشار التكنولوجيا السابقة. تاريخيًا، كانت التقنيات الجديدة القوية توفر مزايا غير متناسبة للمحترفين المدربين، والمؤسسات، والحكومات. لكن نماذج اللغة الكبيرة قلبت هذا الديناميكيات. الأشخاص العاديون—الذين يفتقرون إلى خبرة برمجية متخصصة—استفادوا أكثر من الذكاء الاصطناعي من أي فئة سكانية أخرى. سرّع Vibe Coding هذا الت democratization من خلال القضاء على الحاجة إلى معرفة تقنية مسبقة تمامًا.

وفي الوقت ذاته، منح Vibe Coding المطورين المحترفين القدرة على إنجاز أعمال “لم تكن لتنُفذ بطريقة أخرى”. تغيرت القيود: أصبح بإمكان المطورين فجأة نمذجة أفكار تجريبية بتكلفة قريبة من الصفر، وتنفيذ أدوات متخصصة لمواطن ضعف معينة باستخدام كود مؤقت، أو بناء أدوات مخصصة باستخدام لغات لم يدرسوها رسميًا. استخدم المؤلف Vibe Coding لتطوير محولات BPE متقدمة بلغة Rust دون خبرة تقليدية في اللغات أو اعتماد على مكتبات—عمل كان سيستغرق أسابيع في عصور سابقة، لكنه استهلك ساعات بمساعدة الذكاء الاصطناعي.

الأهم من ذلك، أن هذا التحول يشير إلى أن تطوير البرمجيات ينتقل من مجال مهني متخصص إلى وسط حسابي ديمقراطي. تتلاشى حدود المهنة عندما يمكن لأي شخص توليد كود وظيفي عبر اللغة الطبيعية. تتغير الديناميكيات الأساسية لنظام البرمجيات عندما يتحول الكود من ملكية فكرية نادرة وقيمة إلى مادة وفيرة وقابلة للتلف والتشكيل.

التحول 6: ثورة الواجهات الرسومية في تفاعل الذكاء الاصطناعي

ظهر Google’s Gemini Nano، المعروف في دوائر الذكاء الاصطناعي باسم “Nano Banana”، كواحد من أكثر الابتكارات إرباكًا في 2025—واحد يمتد إلى ما هو أبعد من قدرات توليد الصور. يعكس هذا التطور حقيقة أكبر: نماذج اللغة الكبيرة تمثل النمط الحاسوبي الأساسي التالي بعد ثورة الحواسيب الصغيرة في السبعينيات والثمانينيات.

الدروس التاريخية تثبت أن التغيير الثوري لم يكن في قوة المعالجة، بل في نمط التفاعل. عندما انتقلت الحوسبة من محطات الطرفية وواجهات الأوامر إلى الحواسيب الشخصية، لم يكن التغيير في القدرة الحسابية، بل في وسيلة التفاعل. أنظمة المبكرة كانت تجبر المستخدمين على إدخال أوامر نصية لإنجاز المهام. أعادت الواجهة الرسومية (GUI) تصور العلاقة، معترفة بأن النص هو أبسط شكل من أشكال البيانات للحواسيب، لكنه الأقل تفضيلًا من قبل البشر. يكره البشر قراءة النص؛ فهو مكلف معرفيًا وغير فعال زمنيًا. المعلومات المرئية والمكانية تتوافق بشكل طبيعي أكثر مع الإدراك البشري.

تعمل نماذج اللغة الكبيرة حاليًا ضمن قيد مماثل: فهي مقيدة بشكل أساسي بالتفاعل النصي. النص هو الوسيط الحسابي الأكثر بدائية، لكنه الأكثر غربة عن تفضيل الإنسان. يجب أن تتواصل أنظمة الذكاء الاصطناعي المستقبلية عبر وسائط يفضلها البشر—صور، مخططات، شرائح، لوحات بيضاء، رسوم متحركة، فيديو، تطبيقات ويب، وتصويرات تفاعلية.

ظهرت تطبيقات مبكرة من خلال تهيئات سطحية: تنسيق Markdown، زخارف الرموز التعبيرية، التأكيدات الطباعة. لكن هذه لا تزال حلولًا تركز على النص بشكل أساسي. تظهر ثورة Nano Banana شيئًا مختلفًا نوعيًا—تكامل متطور بين توليد النص، وتوليف الصور، والمعرفة المدمجة بالعالم، مما يمكّن التواصل متعدد الوسائط بشكل شامل. لم تعتمد قفزتها الحقيقية فقط على قدرات الصور؛ بل تنبع من التوليف المنسق لمخرجات متعددة مدمجة في ردود موحدة تعكس الطريقة التي يفضلها البشر في تلقي المعلومات بشكل طبيعي.

يشير هذا التحول إلى اتجاه تطور واجهات الذكاء الاصطناعي. في السنوات القادمة، من المتوقع أن تنتقل أنظمة الذكاء الاصطناعي من “الدردشة مع موقع ويب للذكاء الاصطناعي” إلى بيئات تواصل غنية وتفاعلية بصريًا—مُعيدين تصور تفاعل الإنسان مع الذكاء الاصطناعي بطرق تذكر كيف غيرت واجهات المستخدم الرسومية تفاعل الإنسان مع الحاسوب قبل عقود.

SIX0.8%
IN‎-1.2%
NANO1.42%
BANANA0.06%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت