قدّمت فرق بحثية من جامعة كاليفورنيا في بيركلي طريقة جديدة لتدريب نماذج الذكاء الاصطناعي؛ حيث تم قبول GEPA في ICLR 2026 كبحث Oral. لا تقوم GEPA بتحديث أوزان النموذج ولا تتطلب تدريبًا على وحدات معالجة الرسوميات (GPU)، بل تستخدم LLM واحدًا “يقوم بقراءة سجلات التدريب” لإعادة كتابة مطالبات نظام الذكاء الاصطناعي بشكل متكرر، ما يتيح التفوق بمتوسط 6% على أساليب التعلم المعزز السائدة في 6 مهام، مع تحقيق تفوقٍ يصل إلى 20%، وبتراجع عدد محاولات التدريب المطلوبة (rollouts) بمقدار 35 مرة. بعد أن قامت مجتمعات هندسة الذكاء الاصطناعي بتنظيم نتائج البحث ونشرها، أثارت نقاشًا على منصة X، وقد تم دمجها حاليًا في DSPy كمحسّن من الدرجة الأولى.
GEPA ما الذي تفعله: تحويل سجلات التدريب إلى مواد تعليمية بدل الاكتفاء بالنظر إلى الدرجات
تتمثل سير العمل في طرق التعلم المعزز التقليدية (مثل GRPO) في: جعل الذكاء الاصطناعي ينفّذ المهمة مرة واحدة، ثم إعطاء درجة “+1 أو -1” بناءً على النتائج، وبعدها تعديل أوزان النموذج بشكل متكرر باستخدام هذه الدرجة. المشكلة هي أن تشغيل الذكاء الاصطناعي للمهمة مرة واحدة غالبًا ما يتضمن خطوات استدلال تصل إلى آلاف الرموز (tokens)، واستدعاءات للأدوات، ورسائل أخطاء—وكل هذه التفاصيل الغنية يتم ضغطها في درجة واحدة، بينما تُهمل معلومات العملية. لذلك يحتاج التعلم المعزز إلى تكرار التشغيل لآلاف المرات حتى يصل إلى التقارب.
نهج GEPA عكس ذلك: بعد أن ينهي الذكاء الاصطناعي المهمة في كل مرة، يقوم بتسليم كامل تسلسل العملية (الاستدلال، استدعاءات الأدوات، سجلات الإبلاغ عن الأخطاء) حرفيًا إلى LLM آخر “يقوم بالتأمل” ليقرأه. يقوم LLM الخاص بالتأمل بدور مهندس معماري يقرأ سجلات التشغيل (log)؛ إذ يحدد أين وقع الخطأ، ولماذا وقع، وكيف ينبغي تعديل المطالبات، ثم يعيد كتابة المطالبات الخاصة بذلك الجزء مباشرة. في النهاية، رغم أن تشغيل المهمة يتم مرة واحدة فقط، فإن كمية الإشارة التي تستخلصها GEPA تكون أكبر بكثير من الدرجة الواحدة التي يحصل عليها التعلم المعزز.
لماذا تُحقق نتائج أفضل: تحويل “إعطاء الدرجة” إلى “قراءة كامل تسلسل العملية”
تتفوق GEPA في 6 مهام على GRPO بمتوسط 6%، وبحد أقصى 20%. وبالمقارنة مع مُحسّن مطالبات رئيسي آخر MIPROv2، فإنها تتفوق أيضًا بأكثر من 10% (مع تحسن 12% على معيار المسائل الرياضية AIME-2025). والأهم من ذلك هو تكلفة التدريب: للوصول إلى أداء مماثل، تحتاج GEPA إلى عدد rollouts (تشغيل كامل للمهمة) أقل بمقدار 35 مرة.
ومن بيانات أخرى أيضًا: بعد دمج GEPA مع DSPy، يمكن لـ “Full Program Adapter” تحسين كامل برنامج DSPy (بما في ذلك signature والأجزاء والمخطط التحكمي)، وعند معيار الرياضيات MATH تحقق GEPA نسبة دقة تبلغ 93%، متجاوزة بشكل كبير طريقة ChainOfThought الأصلية في DSPy التي بلغت 67%. كما تُظهر GEPA أداءً ممتازًا بشكل خاص في سير عمل متعدد الوحدات (agents متعددة الوحدات مترابطة)—إذ يمكنها بدقة تحديد وحدة بعينها عند حدوث خطأ وإعادة كتابة مطالباتها، بدلًا من ضبط النظام بالكامل.
من سيبدأ بالاستفادة أولًا: DSPy كمواطن من الدرجة الأولى، وGitHub مفتوح المصدر
تم نشر كود GEPA مفتوحًا على GitHub، وتم دمجه ضمن إطار عمل DSPy بصيغة dspy.GEPA، كما تم نشره بشكل مستقل كمكتبة Python. يضم فريق البحث باحثين عبر مؤسسات مثل UC Berkeley وStanford وNotre Dame وAnthropic وغيرها، ومن بين مؤلفي الورقة Matei Zaharia (المؤسس المشارك لـ Databricks، وهو المؤلف الرئيسي لـ DSPy) وOmar Khattab (المؤلف الرئيسي لـ DSPy).
بالنسبة لمجتمع المطورين، تقدم GEPA حلًا جديدًا لمعضلة “لدينا عدد كبير من rollouts لكننا لا نعرف كيفية الاستفادة منها”—إذ إن معظم الفرق قد راكمت عشرات الآلاف من سجلات تشغيل الـ agents للمهام، لكن بخلاف تصفح بضع سجلات عند حدوث خطأ لمعرفة سبب الخلل، لا توجد طريقة منهجية لتحويل هذه السجلات إلى تحسينات في النموذج. الملاحظة التالية تتمثل في مدى تطبيق GEPA فعليًا داخل سير عمل agents على مستوى الشركات (مثل أتمتة خدمة العملاء، أو الإصلاح التلقائي للبرمجيات)، وما إذا كانت ستظهر تطبيقات مناظر لـ GEPA خارج إطار DSPy.
ظهر تحليل Berkeley GEPA: لا تُحدِّث الأوزان لكي يتعلم الذكاء الاصطناعي مهمة جديدة، بتكلفة تدريب أقل 35 مرة مقارنةً بالتعلم المعزز—بأول مرة على موقع سلسلة الأخبار ABMedia.
مقالات ذات صلة
الأسطول البحري الأمريكي يوقّع عقداً بقيمة تقارب 100 مليون دولار مع Domino Data Lab لتأمين الكشف عن الألغام في مضيق هرمز
XAI Grok يدعم الأصوات المخصّصة: استنساخ مدته دقيقتان والتحقق من الهوية على مرحلتين
إصدار سطح المكتب من OpenAI Codex يضيف وظيفة الحيوانات الأليفة: 3 تلميحات للحالات، والتفريخ بحسب لغة الاستخدام
مُنصة MoonPay تطلق بطاقة MoonAgents، وهي ماستركارد افتراضية لوكلاء الذكاء الاصطناعي، يوم الجمعة
أطلقت OpenAI «Codex Pets»، رفيقًا افتراضيًا مدعومًا بالذكاء الاصطناعي مع توليد مخصص