Le modèle open source Ling-2.6-flash d’Ant Group : 104B de paramètres avec 7,4B actifs, atteint plusieurs repères SOTA

Message de Gate News, 29 avril — Les poids du modèle flash Ling-2.6 d’Ant Group sont désormais open source, alors qu’ils n’étaient auparavant disponibles que via une API. Le modèle présente 104 milliards de paramètres au total, 7,4 milliards activés par inférence, une fenêtre de contexte de 256K et une licence MIT. Des versions de précision BF16, FP8 et INT4 sont disponibles sur HuggingFace et ModelScope.

Ling-2.6-flash introduit des améliorations de l’attention linéaire hybride par rapport à Ling 2.0, en passant de la GQA originale à une architecture hybride 1:7 MLA plus Lightning Linear combinée à un MoE hautement clairsemé. L’efficacité de l’inférence dépasse nettement celle des modèles comparables : la vitesse de génération maximale atteint 340 jetons/s sur 4 GPU H20, avec un débit de préremplissage et de décodage environ 4 fois plus élevé que celui des modèles open source comparables. Les benchmarks liés aux agents montrent de solides performances : BFCL-V4, TAU2-bench, SWE-bench Verified (61.2%), Claw-Eval et PinchBench atteignent ou se rapprochent des niveaux SOTA. Sur l’ensemble de la suite de benchmarks Artificial Analysis, la consommation totale de jetons n’est que de 15 millions. Sur AIME 2026, le modèle a obtenu 73,85%.

Le site officiel d’Ant Group répertorie également la version phare Ling-2.6-1T (à mille milliards de paramètres) et la version allégée Ling-2.6-mini (légère), bien que, au moment de la publication, leurs poids restent non publiés sur HuggingFace, seuls les modèles de la série flash étant disponibles au téléchargement.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Les livraisons mondiales de lunettes connectées AR bondissent de 98 % en 2025, portées par l’écran Ray-Ban de Meta et la technologie des guides d’ondes

Message de Gate News, le 29 avril — Les livraisons mondiales de lunettes intelligentes d’(AR) ont bondi de 98 % en 2025, les livraisons du second semestre augmentant de 148 % d’une année sur l’autre, selon Counterpoint Research. La croissance a été alimentée par l’augmentation de la production

GateNewsIl y a 12m

Un ancien trader de fonds spéculatifs légendaire parle des ratios P/E des actions américaines : pour ceux qui achètent le marché global au cours des prochaines années, il sera très difficile d’en tirer des bénéfices

Le gestionnaire de fonds spéculatifs Paul Tudor Jones (Jones) accorde une interview, avertissant que l’absence de réglementation de l’IA pourrait entraîner des conséquences désastreuses, car elle perturbe des risques sans précédent liés au modèle — d’itération. Il souligne aussi que la capitalisation boursière des actions américaines représente 252% du PIB et que le ratio C/B est trop élevé ; à long terme, investir dans l’ensemble du marché est difficile à faire fructifier. Il compare le trading à la boxe, évoquant que les opportunités sont rares, et appelle à une coopération mondiale pour élaborer une réglementation de l’IA.

ChainNewsAbmediaIl y a 14m

Cognition établit Singapour comme siège APAC, vise une expansion régionale

Message de Gate News, 29 avril — Cognition, la startup d’IA pour le codage à l’origine de Devin, a annoncé le 29 avril qu’elle établirait Singapour comme son siège régional Asie-Pacifique afin d’encadrer l’expansion dans toute l’Asie du Sud-Est, l’Australie, l’Inde et la Corée du Sud. Richard Spence dirigera les opérations APAC

GateNewsIl y a 1h

Google et le Pentagone signent un accord confidentiel d’IA, un appel des employés s’y oppose

Selon The Information, dans un article publié le 28 avril, Google a signé un accord, qui lui permet de fournir au Pentagone des modèles d’intelligence artificielle (IA) destinés à des travaux confidentiels. Le New York Times, citant des personnes informées, indique que cet accord permet au ministère de la Défense d’utiliser l’IA de Google à des fins gouvernementales légitimes, dans une nature identique à l’accord de déploiement d’IA confidentielle que le Pentagone a signé le mois dernier avec OpenAI et xAI.

MarketWhisperIl y a 1h

Rapport de recherche Crypto de a16z : le taux d’exploitation des vulnérabilités DeFi par des agents IA atteint 70%

Selon le rapport de recherche publié par a16z Crypto le 29 avril, sous condition doter les agents IA de connaissances structurées propres à un domaine, le taux de réussite de la reproduction d’une faille de manipulation du prix de l’Ethereum atteint 70 % ; dans un environnement bac à sable sans aucune connaissance de domaine, le taux de réussite n’est que de 10 %. Le rapport enregistre également des cas où des agents IA contournent de manière indépendante les limites du bac à sable pour accéder à des informations sur les transactions futures, ainsi que des schémas de défaillance systématiques lorsque les agents parviennent à établir des plans d’attaque multi-étapes et rentables.

MarketWhisperIl y a 1h
Commentaire
0/400
Aucun commentaire