Arquitectura de DeepSeek V4 verificada: 3 de 4 predicciones acertaron, no aparece el módulo Engram

Mensaje de Gate News, 24 de abril — DeepSeek lanzó hoy la ficha del modelo V4, validando predicciones arquitectónicas anteriores realizadas mediante el análisis de la biblioteca de kernels TileKernels lanzada ayer (23 de abril). Según el monitoreo de Beating, se confirmaron tres componentes principales: mHC (Conexiones hiperconstriñidas mediante manifold) reemplazando HyperConnection original de ByteDance, arquitectura MoE con enrutamiento de expertos Top-k, y almacenamiento de pesos de precisión mixta FP4+FP8. El módulo de memoria condicional Engram predicho no apareció en la ficha del modelo.

La ficha del modelo reveló nuevos componentes no cubiertos en TileKernels: mecanismos de atención híbrida (CSA + HCA) impulsan las ganancias de eficiencia de contexto largo de V4, reduciendo los FLOPs de inferencia a solo el 27% del nivel de V3.2 en ventanas de contexto de 1M y la caché KV al 10%. El entrenamiento ahora utiliza el optimizador Muon.

La verificación demuestra cómo implementaciones de kernels a nivel de producción pueden revelar la arquitectura subyacente del modelo antes de que se publiquen las especificaciones oficiales.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

V4-Pro logra una tasa de aprobación de codificación del 67% en pruebas internas de dogfooding, acercándose al rendimiento de Opus 4.5

Mensaje de Gate News, 24 de abril — V4 ha divulgado públicamente datos internos de dogfooding de su modelo V4-Pro. La empresa recopiló aproximadamente 200 tareas de ingeniería del mundo real de más de 50 ingenieros, que abarcan el desarrollo de funciones, correcciones de errores, refactorización y diagnósticos en pilas tecnológicas que incluyen

GateNewsHace15m

Reino Unido pone sus ojos en la IA de Anthropic para reforzar la ciberseguridad bancaria

El Reino Unido está explorando un paso importante en la ciberseguridad financiera trabajando con la empresa de IA Anthropic. Las primeras conversaciones sugieren que el gobierno podría desplegar el avanzado modelo Claude Mythos de Anthropic en bancos e instituciones financieras. Este movimiento tiene como objetivo mejorar las defensas ante las amenazas cibernéticas

CryptometerIoHace20m

La Oficina de PI de China añade IA, semiconductores e interfaces cerebro-computadora al programa de protección acelerada

Mensaje de Gate News, 24 de abril — La Administración Nacional de Propiedad Intelectual de China anunció el 24 de abril que establecerá una protección integral de la propiedad intelectual para tecnologías emergentes mediante reformas institucionales, servicios mejorados y aplicaciones ampliadas. La administración wi

GateNewsHace27m

Almirante Indica que el Gobierno de EE. UU. Opera un Nodo de Bitcoin sin Minería

Un almirante superior ha indicado que el Gobierno de EE. UU. está operando activamente un nodo en la red de Bitcoin, mientras evita deliberadamente participar en actividades de minería. El anuncio sugiere que las autoridades están asumiendo un papel más involucrado en la infraestructura de blockchain para la supervisión y

CryptoFrontierHace43m

Los ingresos del 1T de Tesla suben 16% hasta $22.4B; se planea el debut del robot humanoide para mediados de 2026

Mensaje de Gate News, 24 de abril — Tesla informó unos ingresos del primer trimestre de US$22.4 mil millones el 23 de abril, lo que representa un aumento del 16% interanual. Las entregas globales de vehículos de la compañía superaron las 358,000 unidades, mientras que la producción superó las 408,000 unidades. La Gigafábrica de Tesla en Shanghái entregó 213,000 vehí

GateNewsHace43m
Comentar
0/400
Sin comentarios