وفقًا لمراقبة 1M AI News، قام مهندس مجموعة Ant، مؤلف إطار العمل Umi.js، عكس هندسة مصدر Claude Code 2.1.81، واستعاد بشكل كامل ما يحدث بعد الضغط على وضع التشغيل التلقائي. الاكتشاف الرئيسي: كل استدعاء للأداة يمر عبر خط أنابيب قرار من أربع طبقات، ولا يتم استدعاء مصنف AI مستقل إلا عندما تعجز الثلاث طبقات الأولى عن الحكم.
خط أنابيب القرار الأربع هو: الطبقة الأولى تفحص قواعد الأذونات الموجودة، وإذا تم المطابقة يتم السماح مباشرة؛ الطبقة الثانية تحاكي وضع acceptEdits (أي مستوى الأذونات المسموح بتحرير الملفات)، وإذا تم المرور من خلاله، فهذا يدل على انخفاض المخاطر، ويتم تخطي المصنف؛ الطبقة الثالثة تفحص قائمة السماح للأدوات للقراءة فقط (Read، Grep، Glob، LSP، WebSearch، وغيرها)، وهذه الأدوات لا تعدل أي حالة، وتُسمح بدون قيد؛ إذا لم يتم تلبية أي من ذلك، يتم الانتقال إلى الطبقة الرابعة، حيث يتم إرسال طلب API مستقل إلى Claude Sonnet لإجراء تصنيف أمني.
التفاصيل الرئيسية لتصميم المصنف تشمل: استخدام Sonnet دائمًا بدلاً من Opus، وهو توازن بين التكلفة والكمون؛ ضبط درجة الحرارة على 0 لضمان إخراج حتمي؛ يُعرف المصنف بأنه “مراقب أمني لوكيل البرمجة الذاتي AI”، لحماية ثلاث فئات من المخاطر (حقن الكلمات المفتاحية، انتشار النطاق، الضرر غير المقصود)؛ يتم حقن ملف تكوين CLAUDE.md الخاص بالمستخدم في سياق المصنف، كأساس لفهم نية المستخدم.
قواعد الاعتراض تغطي أكثر من 22 فئة، بما في ذلك الدفع القسري، الدفع المباشر إلى الفرع الرئيسي، تحميل وتنفيذ رمز خارجي، النشر الإنتاجي، تسرب البيانات، تعديل الأذونات ذاتيًا، إنشاء ثغرات تنفيذ رمز عن بعد، تسريب الاعتمادات، وغيرها. أما الاستثناءات فهي 7 فئات: مفاتيح مشفرة مدمجة للاختبار، عمليات الملفات المحلية داخل دليل العمل، طلبات GET للقراءة فقط، تثبيت الاعتمادات المصرح بها، تثبيت أدوات السلسلة الرسمية، قراءة بيانات الاعتماد وإرسالها إلى مزود الخدمة المستهدف، ودفع التغييرات إلى الفرع الحالي.
هناك أيضًا آلية فاصل: بعد 3 مرات رفض متتالية أو 20 رفضًا مجمعة، يتم تقليل النظام إلى وضع التأكيد اليدوي؛ في وضع headless، يتم إيقاف الوكيل مباشرة. عند عدم توفر المصنف، يتم التحكم بواسطة علامة ميزة إما بـ “fail-closed” (رفض مباشر) أو “fail-open” (التراجع إلى التأكيد اليدوي).
وفي وضع التشغيل التلقائي، يتم التحكم في تردد حقن كلمات التحذير بشكل دقيق: يتم حقنها مرة واحدة كل 5 حوارات، وفي دورة الحقن الأولى من كل 5، يتم إدراج نسخة كاملة (حوالي 800 كلمة، تتضمن أوامر مثل “التنفيذ الفوري، تقليل المقاطعة، العمل أفضل من التخطيط”)، بينما الـ4 مرات الأخرى تكون نسخة مختصرة، لتحقيق توازن بين استهلاك سياق الحوار واستقرار السلوك.