وفقا لأخبار BlockBeats، في 3 مارس، تعاون المطور مانجيت سينغ (GitHub: maderix) مع كلود أوبوس لعكس هندسة واجهات برمجة التطبيقات الخاصة غير المعلنة من آبل لتنفيذ تدريب على الشبكات العصبية يحتوي على الانتشار العكسي على محرك آبل العصبي (ANE) لشريحة M4 لأول مرة. يعد ANE مسرع تصميم الاستدلال من آبل، ولم يتم فتح القدرة الرسمية على التدريب أبدا، ويمكن للمطورين فقط استدعاء وظيفة الاستدلال الخاصة به بشكل غير مباشر من خلال إطار CoreML.
تجاوز المشروع CoreML وربط مباشرة بحزمة البرمجيات الكاملة من أكثر من 40 فئة خاصة مثل _ANEClient و_ANECompiler إلى نواة IOKit، واكتشف واجهة _ANEInMemoryModelDescriptor التي تترجم النموذج مباشرة في الذاكرة - وهي المفتاح لتحقيق التدريب، حيث يحتاج كل تحديث وزن إلى إعادة ترجمة. حاليا، يتم تدريب طبقة محول واحدة (dim=768، seq=512)، مع 9.3 مللي ثانية لكل خطوة على M4، واستخدام ANE 11.2٪ (1.78 TFLOPS، ذروة نظرية 15.8 TFLOPS)، ويتم حساب تدرجات إدخال الانتشار الأمامي والخلفي على ANE، ويتم إجراء تدرجات الوزن ومحسدات آدم على وحدة المعالجة المركزية.
وجد المشروع أيضا أن البدائيات الحاسوبية الأساسية ل ANE هي الالتفاف وليس ضرب المصفوفة، وأن التعبير عن ضرب المصفوفة بالتفافات 1x1 يمكن أن يحقق زيادة تزيد عن معدل النقل بحوالي 3 أضعاف، وتجاوز المكالمات المباشرة في CoreML يمنح مكسبا إضافيا من 2-4 أضعاف، كما أن الترويج الرسمي من آبل ل “38 TOPS” مضلل. لا يزال المشروع في مراحله الأولى: التدريب على طبقة واحدة فقط، وتستخدم البيانات التركيبية، وهناك حوالي 119 تسريبا للموارد المجمعة التي تحتاج إلى إعادة التشغيل لتجنب العملية، ولا تزال هناك تدريبات متعددة الطبقات ودعم بيانات عملي قيد التطوير. المشروع مفتوح المصدر بموجب بروتوكول MIT وحصل على حوالي 2800 نجمة خلال 5 أيام من الإصدار.