開發者逆向工程Apple Neural Engine私有API，首次在ANE上實現神經網絡訓練

GateNews

2026-03-03 06:09:13

BlockBeats 消息，3 月 3 日，開發者 Manjeet Singh（GitHub: maderix）與 Claude Opus 協作，通過逆向工程 Apple 未公開的私有 API，首次在 M4 芯片的 Apple Neural Engine（ANE）上實現了包含反向傳播的神經網絡訓練。ANE 是 Apple 專為推理設計的加速器，官方從未開放訓練能力，開發者只能通過 CoreML 框架間接調用其推理功能。

該項目繞過 CoreML，直接映射了從 _ANEClient、_ANECompiler 等 40 余個私有類到 IOKit 內核驅動的完整軟體棧，並發現了可在記憶體中直接編譯模型的 _ANEInMemoryModelDescriptor 接口——這是實現訓練的關鍵，因為每次權重更新都需要重新編譯。當前實現了單個 transformer 層（dim=768, seq=512）的訓練，M4 上每步耗時 9.3ms，ANE 利用率 11.2%（1.78 TFLOPS，理論峰值 15.8 TFLOPS），前向和反向傳播的輸入梯度在 ANE 上計算，權重梯度和 Adam 優化器在 CPU 上完成。

該項目還發現 ANE 的核心計算原語是卷積而非矩陣乘法，用 1x1 卷積表達矩陣乘法可獲得約 3 倍吞吐提升，繞過 CoreML 直接調用則有 2-4 倍額外增益，Apple 官方宣傳的「38 TOPS」存在誤導。目前項目仍處於早期階段：僅支持單層訓練、使用合成數據、存在約 119 次編譯後的資源洩漏需重啟進程規避，多層訓練和真實數據支持尚在開發中。項目以 MIT 協議開源，發布 5 天獲得約 2800 星。

查看原文

免責聲明：本頁面資訊可能來自第三方，不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考，不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證，對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為，價格波動劇烈，您可能損失全部投資本金。請充分了解相關風險，並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明。

留言

0/400

暫無留言