Ingenieros de Ant analizaron el código fuente de Claude, revelando el mecanismo de la línea de decisión de cuatro niveles en el modo automático

Noticias de Gate News, el 25 de marzo, ingenieros de Ant Group, autores del framework frontend Umi.js, realizaron ingeniería inversa del código fuente de Claude Code 2.1.81 y restauraron completamente el mecanismo de decisión en Modo Automático. El hallazgo principal: cada llamada a herramienta pasa por una línea de cuatro decisiones, y solo cuando las tres primeras no puedan determinar, se invoca un clasificador de IA independiente para la revisión de seguridad.

La línea de decisiones consta de cuatro niveles: el primero verifica las reglas de permisos existentes, y si hay una coincidencia, se permite directamente; el segundo simula el modo acceptEdits (permiso para editar archivos), y si en este modo se aprueba, indica un riesgo muy bajo y se omite el clasificador; el tercero revisa la lista blanca de herramientas de solo lectura (Read, Grep, Glob, LSP, WebSearch, etc.), que no modifican ningún estado y se permiten sin condiciones; si ninguna de estas condiciones se cumple, se pasa al cuarto nivel, que envía una solicitud API independiente a Claude Sonnet para clasificación de seguridad.

Los detalles clave del diseño del clasificador incluyen: usar siempre Sonnet en lugar de Opus, como un equilibrio entre costo y latencia; establecer la temperatura en 0 para garantizar resultados deterministas; el clasificador se define como un «monitor de seguridad para agentes autónomos de programación IA», protegiendo contra tres tipos de riesgos (inyección de prompts, propagación de alcance, daños accidentales); el archivo de configuración CLAUDE.md del usuario se inyecta en el contexto del clasificador, sirviendo como base para interpretar la intención del usuario.

Las reglas de bloqueo cubren más de 22 categorías, incluyendo force push, push directo a la rama main, descarga y ejecución de código externo, despliegue en producción, fuga de datos, modificación de permisos, creación de vectores de ejecución remota, filtración de credenciales, etc. Las excepciones de permiso incluyen 7 tipos: claves codificadas de prueba, operaciones con archivos locales en el directorio de trabajo, solicitudes GET de solo lectura, instalación de dependencias declaradas, instalación de herramientas oficiales, lectura de credenciales de configuración enviadas al proveedor objetivo, y push a la rama de trabajo actual.

El sistema también implementa un mecanismo de corte: después de 3 rechazos consecutivos o 20 rechazos acumulados, el sistema pasa a modo de confirmación manual; en modo headless, se detiene directamente el agente. Cuando el clasificador no está disponible, una bandera de función controla si el sistema opera en modo «fail-closed» (rechazo directo) o «fail-open» (degradación a confirmación manual).

En modo Automático, la inyección de palabras clave de comportamiento tiene un control de frecuencia preciso: se inyecta cada 5 turnos de diálogo, y en cada ciclo de 5 inyecciones, la primera es la versión completa (aproximadamente 800 palabras, incluyendo instrucciones como «ejecutar inmediatamente, reducir interrupciones, acción sobre planificación» y otras seis directrices), mientras que las otras 4 son versiones resumidas en una línea, equilibrando el uso del espacio en la ventana de contexto y la estabilidad del comportamiento.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

野村證券調查:八成機構投資者計劃以 2% 至 5% AUM 配置加密資產

野村證券(Nomura)及其加密貨幣子公司 Laser Digital 的 2026 年數位資產機構投資者調查顯示,近五分之四的受訪機構投資者計劃將其管理資產總額(AUM)的 2% 至 5% 配置入加密貨幣市場,多數機構表示計劃在未來一年內進行,而非立即投資。

MarketWhisperhace5h

Encuesta de Nomura: el 80% de los inversores institucionales está dispuesto a asignar 2-5% a las criptomonedas

Una encuesta de Nomura revela que el 80% de los inversores institucionales pretende invertir 2-5% en criptomonedas, favoreciendo estrategias de rendimiento como el staking y el préstamo. La claridad regulatoria y la gestión de riesgos son claves para impulsar el interés institucional en los activos digitales.

GateNewshace13h

El mercado de stablecoins alcanza un ATH de $322B , el volumen de operaciones del 1T de 2026 llega a $8.3 billones

El mercado de las stablecoins experimentó un crecimiento significativo, al dispararse $2.25 mil millones hasta alcanzar $322 mil millones, a pesar de una contracción más amplia del mercado cripto. USDC registró un aumento sustancial de la oferta, mientras que USDT mantuvo su cuota de mercado. Las stablecoins que devengan rendimiento contribuyeron notablemente a este crecimiento, y la actividad de transacciones alcanzó un máximo histórico.

GateNewshace13h

La Fundación Ethereum Anuncia los Resultados del Proyecto ETH Rangers: Más de $5.8M en Activos Recuperados o Congelados

El proyecto ETH Rangers de la Fundación Ethereum ha completado con éxito su labor, financiando a 17 investigadores para mejorar la seguridad pública en el ecosistema. Los logros incluyen recuperar $5.8M en activos, identificar más de 785 vulnerabilidades y desarrollar varias herramientas de seguridad.

GateNewshace18h

Los principales VCs cripto ven descensos significativos en AUM en medio de la caída del mercado de 2025

Durante la caída del mercado cripto de 2025, las principales firmas de capital de riesgo vieron descensos significativos en su AUM, pero Haun Ventures creció un 30%. Paradigm y a16z están recaudando más de $4.2 mil millones para nuevos fondos, lo que destaca el desempeño variado entre las firmas.

GateNewshace21h
Comentar
0/400
Sin comentarios