Chinas Z.AI veröffentlicht das erste große KI-Bildgenerierungsmodell, das ohne amerikanische Chips trainiert wurde

Decrypt

2026-01-14 20:11:00

GLM-5,52%

ATLAS-1,1%

DEEPSEEK-4,82%

Kurzfassung

Chinas Z.AI veröffentlichte ein bedeutendes Open-Source-Bildmodell, das vollständig auf Huawei-Chips trainiert wurde.
Es verwendet ein hybrides autoregressives-Diffusions-Design, das die Textgenauigkeit und die räumliche Kontrolle verbessert.
Die Veröffentlichung signalisiert Chinas Bestrebungen zur KI-Selbstständigkeit ohne US-GPUs.

Das chinesische Unternehmen für künstliche Intelligenz Z.AI hat am Mittwoch ein Open-Source-Bildgenerierungsmodell veröffentlicht, das vollständig auf Huawei-Prozessoren trainiert wurde. Es ist das erste Mal, dass ein großes KI-Modell seinen vollständigen Trainingszyklus ohne amerikanische Hardware abgeschlossen hat. Der Schritt unterstreicht eine potenzielle langfristige Herausforderung für Nvidias Dominanz bei KI-Chips, da er zeigt, dass eines der führenden chinesischen KI-Unternehmen große Modelle ohne US-GPUs trainieren kann. Das Modell ist bereits auf Hugging Face zum Download verfügbar und liefert gute—wenn auch nicht beeindruckende nach heutigen Maßstäben—Ergebnisse in Bezug auf Ästhetik und kohärenten Text, sowie eine ausgezeichnete räumliche Wahrnehmung basierend auf unseren ersten Schnelltests.

Bild, das mit Z.AI’s neuem Modell generiert wurde.

Das in Peking ansässige Unternehmen, das letzte Woche $558 Millionen bei seinem Hongkonger Börsengang aufgenommen hat, trainierte das Modell, genannt GLM-Image, auf Huawei’s Ascend Atlas 800T A2 Servern unter Verwendung des MindSpore-Frameworks. „Wir hoffen, dass dies der Gemeinschaft wertvolle Referenzen bietet, um das Potenzial inländischer Rechenleistung zu erkunden“, sagte Z.AI in einer Erklärung, die mit dem South China Morning Post geteilt wurde.

Einführung von GLM-Image: Ein Meilenstein in der Open-Source-Bildgenerierung.

GLM-Image verwendet eine hybride auto-regressive plus Diffusions-Architektur, die ein starkes globales semantisches Verständnis mit hochpräzisen visuellen Details kombiniert. Es entspricht in der Gesamtqualität den gängigen Diffusionsmodellen… pic.twitter.com/cjtUYRkge5

— Z.ai (@Zai_org) 14. Januar 2026

GLM-Image kombiniert autoregressive und Diffusions-Techniken in einer hybriden Architektur mit insgesamt 16 Milliarden Parametern. Die autoregressive Komponente, basierend auf Z.AI’s Sprachmodell GLM-4, übernimmt das Verständnis von Anweisungen und die Bildkomposition, während ein Diffusions-Decoder feine Details verfeinert. Dieser Ansatz spiegelt Techniken wider, die auch bei OpenAI’s neuestem Bildgenerierungsmodell gpt-image-1.5 verwendet werden, das eine überlegene Textdarstellung und Prompt-Übereinstimmung im Vergleich zu reinen Diffusionsmodellen wie Stable Diffusion gezeigt hat. Diffusionsmodelle erstellen Bilder, indem sie mit zufälligem visuellen Rauschen beginnen und es langsam in ein Bild umwandeln, während autoregressive Modelle Bilder Schritt für Schritt aufbauen und jedes Teil basierend auf dem vorherigen vorhersagen. Diffusion ist großartig für die allgemeine Realitätsnähe, kann aber bei präzisen Details wie Text oder Layout Schwierigkeiten haben, während autoregressive Modelle bei Struktur und Befolgung von Anweisungen hervorragend sind. Derzeit ist Diffusion die dominierende Technik unter Open-Source-KI-Bildgeneratoren.

Neue Hybridsysteme kombinieren beide Ansätze, indem sie autoregressive Generierung zur Planung des Bildes verwenden und Diffusion, um das Endergebnis zu verfeinern.

Bild: Z.AI

Die Veröffentlichung ist für Z.AI bedeutend, das 2025 aufgrund angeblicher Verbindungen zum chinesischen Militär auf die US-Liste gesetzt wurde. Diese Einstufung hat das Unternehmen von Nvidias H100- und A100-Prozessoren abgeschnitten. Jetzt hat Z.AI bewiesen, dass auch von der schwarzen Liste geführte Firmen weiterhin wettbewerbsfähige KI-Systeme mit inländischer Hardware produzieren können, eine Entwicklung, die Peking schon lange demonstrieren wollte. Kurz nach der Ankündigung von Z.AI berichtete Reuters, dass chinesische Zollbehörden Anweisungen an Agenten gegeben hätten, Nvidia H200-Chips am Einfuhrweg zu blockieren. Regierungsbeamte beriefen Treffen mit Technologieunternehmen ein, bei denen ihnen gesagt wurde, die Chips nur bei Bedarf zu kaufen. Die Formulierung war laut Quellen streng genug, um im Wesentlichen ein „Verbot vorerst“ zu bedeuten. Peking scheint zu signalisieren, dass chinesische KI-Labore in der Lage sind, leistungsfähige Modelle ohne amerikanischen Silizium zu bauen, was den Druck auf chinesische Firmen verringert, Nvidia-Hardware zu horten. Der H200, der etwa die sechsfache Leistung des H20-Chips liefert, den Peking bereits im August letzten Jahres blockierte, hatte Bestellungen von chinesischen Unternehmen für mehr als zwei Millionen Einheiten zu je 27.000 US-Dollar generiert. Analysten des Center for Security and Emerging Technologies an der Georgetown-Universität haben festgestellt, dass Chinas Chip-Strategie darauf beruht, die geringere Leistung pro Chip durch riesige Cluster von Huawei-Prozessoren auszugleichen. Dieser Ansatz funktioniert, erfordert aber mehr Hardware, mehr Energie und mehr Ingenieuraufwand. „Eine der wichtigsten Beschränkungen bei dieser Strategie ist Chinas Fähigkeit, genügend Chips im Inland zu produzieren, um die Lücke in der Leistungsfähigkeit zu schließen und aufzuholen“, sagte die leitende Forschungsanalystin Hanna Dohmen im November gegenüber CNBC. Laut Huawei’s eigener Roadmap wird der nächste Generation-Chip im Jahr 2026 tatsächlich schlechter sein als das aktuelle Flaggschiff in Bezug auf rohe Leistung. Solche Einschätzungen könnten jedoch die Möglichkeiten chinesischer Labore, durch algorithmische Effizienz zu erreichen, unterschätzen, wie DeepSeek gezeigt hat, das durch GPU-Optimierung auf Assembly-Ebene wettbewerbsfähige Modelle mit weniger Chips trainierte.

Quelle: Council on Foreign Relations

Z.AI’s GLM-Image erreichte branchenführende Benchmark-Werte bei Open-Source-Modellen für Textdarstellung und chinesische Zeichen, so der technische Bericht des Unternehmens. Personen ohne die passende Hardware können es auch online mit API-Zugang versuchen, der bei $0.014 pro generiertem Bild liegt, oder über einen kostenlosen Hugging Face Space, das von Z.AI gepflegt wird. Z.AI wurde das erste chinesische „KI-Tiger“-Unternehmen, eine Gruppe von Startups, die große Sprachmodelle entwickeln, um mit OpenAI und Anthropic zu konkurrieren, das an die Börse ging. Seit dem Börsengang ist die Aktie um etwa 80 % gestiegen, getrieben von Investorenenthusiasmus für chinesische KI-Firmen wie DeepSeek oder Alibaba im Zuge Chinas inländischer Chip-Bestrebungen. Huawei bereitet sich zudem vor, die Produktion seiner Ascend-Prozessoren in diesem Jahr deutlich zu steigern. Die Präsenz des Unternehmens auf KI-Konferenzen in ganz China ist gewachsen, während es versucht, sich als Rückgrat einer nationalen KI-Infrastruktur zu positionieren, die nicht mehr von Santa Clara abhängt.

Original anzeigen

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Kommentieren

0/400

Keine Kommentare