Z.AI de Chine publie le premier grand modèle de génération d'images IA entraîné sans puces américaines

Decrypt
GLM5,42%
ATLAS4,75%

En bref

  • Z.AI, une entreprise chinoise d’intelligence artificielle, a publié un modèle d’image open-source majeur qui a été entièrement entraîné sur des puces Huawei.
  • Il utilise une conception hybride autoregressive-diffusion qui améliore la précision du texte et le contrôle spatial.
  • La sortie marque la volonté de la Chine de renforcer son autonomie en IA sans GPU américains.

L’entreprise chinoise d’intelligence artificielle Z.AI a publié mercredi un modèle de génération d’images open-source entraîné entièrement sur des processeurs Huawei, marquant la première fois qu’un modèle d’IA majeur a achevé son cycle d’entraînement complet sans dépendre du matériel américain. Ce mouvement met en lumière un défi potentiel à long terme à la domination de Nvidia dans les puces IA, puisqu’il montre que l’une des principales entreprises chinoises d’IA peut entraîner de grands modèles sans recourir aux GPU fabriqués aux États-Unis. Le modèle est déjà disponible en téléchargement sur Hugging Face et produit de bons résultats—mais pas impressionnants selon les standards actuels—en termes d’esthétique et de cohérence du texte, et montre une excellente conscience spatiale d’après nos premiers tests rapides.

Image générée avec le nouveau modèle de Z.AI.

L’entreprise basée à Pékin, qui a levé $558 millions lors de son IPO à Hong Kong la semaine dernière, a entraîné le modèle, appelé GLM-Image, sur les serveurs Ascend Atlas 800T A2 de Huawei en utilisant le framework MindSpore. « Nous espérons que cela pourra fournir une référence précieuse à la communauté pour explorer le potentiel de la puissance de calcul domestique », a déclaré Z.AI dans un communiqué partagé avec le South China Morning Post.

Présentation de GLM-Image : une nouvelle étape dans la génération d’images open-source.

GLM-Image utilise une architecture hybride auto-regressive plus diffusion, combinant une compréhension sémantique globale forte avec des détails visuels de haute fidélité. Il rivalise avec les modèles de diffusion grand public en qualité globale… pic.twitter.com/cjtUYRkge5

— Z.ai (@Zai_org) 14 janvier 2026

GLM-Image combine des techniques autoregressives et de diffusion dans une architecture hybride avec 16 milliards de paramètres au total. La composante autoregressive, basée sur le modèle linguistique GLM-4 de Z.AI, gère la compréhension des instructions et la composition d’images, tandis qu’un décodeur de diffusion affine les détails fins. Cette approche ressemble aux techniques utilisées par le dernier modèle de génération d’images d’OpenAI, gpt-image-1.5, qui a démontré une meilleure rendu du texte et une meilleure conformité aux prompts par rapport aux modèles de diffusion pure comme Stable Diffusion. Les modèles de diffusion créent des images en partant d’un bruit visuel aléatoire et en le raffinant lentement en une image, tandis que les modèles autoregressifs construisent les images étape par étape, en prédisant chaque partie en fonction de ce qui est venu avant. La diffusion est excellente pour le réalisme global mais peut avoir du mal avec des détails précis comme le texte ou la mise en page, alors que les modèles autoregressifs excellent dans la structure et le suivi des instructions. Actuellement, la diffusion est la technique reine parmi les générateurs d’images IA open-source.

De nouveaux systèmes hybrides combinent ces deux approches, utilisant la génération autoregressive pour planifier l’image et la diffusion pour peaufiner le résultat final.

Image : Z.AI

La sortie est significative pour Z.AI, qui a été inscrit sur la liste noire de Washington en 2025 pour ses liens présumés avec l’armée chinoise. Cette désignation a coupé la société de ses processeurs Nvidia H100 et A100. Maintenant, Z.AI a prouvé que des entreprises inscrites sur la liste noire peuvent encore produire des systèmes d’IA compétitifs en utilisant du matériel domestique, un développement que Pékin cherche depuis longtemps à démontrer. Juste après l’annonce de Z.AI, Reuters a rapporté que les autorités douanières chinoises avaient ordonné aux agents de bloquer l’entrée en Chine des puces Nvidia H200. Des responsables gouvernementaux ont convoqué des entreprises technologiques lors de réunions où il leur a été dit de ne pas acheter ces puces sauf si nécessaire. Selon des sources, la formulation était suffisamment sévère pour constituer « pratiquement une interdiction pour l’instant ».  Pékin semble indiquer que les laboratoires d’IA chinois peuvent construire des modèles performants sans silicium américain, réduisant ainsi l’urgence pour les entreprises chinoises de stocker du matériel Nvidia. La H200, qui offre environ six fois la performance de la puce H20 que Pékin a déjà bloquée en août dernier, avait généré des commandes de plus de deux millions d’unités à 27 000 dollars chacune de la part d’entreprises chinoises. Les analystes du Center for Security and Emerging Technologies de Georgetown ont noté que la stratégie de puces de la Chine repose sur la compensation d’une performance par puce inférieure par de vastes grappes de processeurs Huawei. Cette approche fonctionne, mais nécessite plus de matériel, plus d’énergie et plus d’efforts d’ingénierie. « L’une des contraintes clés de cette stratégie est la capacité de la Chine à produire suffisamment de puces en interne pour combler et suivre le retard en capacité », a déclaré Hanna Dohmen, analyste principale, à CNBC en novembre. Selon la feuille de route de Huawei, sa puce de nouvelle génération en 2026 sera en réalité moins performante que son modèle phare actuel en termes de puissance brute. Mais de telles évaluations peuvent sous-estimer ce que les laboratoires chinois peuvent réaliser grâce à l’efficacité algorithmique, comme DeepSeek l’a démontré en entraînant des modèles compétitifs avec moins de puces grâce à une optimisation au niveau des GPU en assemblage.

Source : Conseil des Relations Extérieures

Le GLM-Image de Z.AI a obtenu des scores de référence de premier plan dans l’industrie parmi les modèles open-source pour le rendu de texte et la génération de caractères chinois, selon le rapport technique de l’entreprise. Ceux qui ne disposent pas du matériel adéquat peuvent également l’essayer en ligne avec un accès API facturé à 0,014 $ par image générée, ou via un espace Hugging Face gratuit maintenu par Z.AI. Z.AI est devenue la première des « tigres de l’IA » chinoise, un groupe de startups développant de grands modèles linguistiques pour rivaliser avec OpenAI et Anthropic, à entrer en bourse. Son action a augmenté d’environ 80 % depuis son introduction, suite à l’enthousiasme des investisseurs pour des entreprises d’IA chinoises comme DeepSeek ou Alibaba, dans le contexte des ambitions nationales en matière de puces. Huawei, quant à elle, se prépare à augmenter fortement la production de ses processeurs Ascend cette année. La présence de la société lors des conférences sur l’IA en Chine est devenue plus visible alors qu’elle tente de se positionner comme l’épine dorsale d’une infrastructure nationale d’IA qui ne dépend plus de Santa Clara.

Voir l'original
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)