Китайська Z.AI випустила першу основну модель генерації AI-зображень, навчану без американських чіпів

Decrypt
GLM2,03%
ATLAS1,56%

Коротко

  • Китайська компанія Z.AI випустила основну відкриту модель для генерації зображень, яка була повністю навчена на чипах Huawei.
  • Вона використовує гібридний автрорегресивно-дифузійний дизайн, що підвищує точність тексту та просторовий контроль.
  • Випуск сигналізує про прагнення Китаю до самостійності в сфері ШІ без використання американських GPU.

Китайська компанія з штучного інтелекту Z.AI у середу випустила модель для генерації зображень з відкритим кодом, повністю навчану на процесорах Huawei, що є першим випадком, коли велика модель ШІ завершила повний цикл навчання без використання американського обладнання. Цей крок підкреслює потенційний довгостроковий виклик домінуванню Nvidia у галузі чипів для ШІ, оскільки показує, що одна з провідних китайських компаній може навчати великі моделі без reliance на GPU виробництва США. Модель вже доступна для завантаження на Hugging Face і дає хороші — хоча й не вражаючі за сучасними стандартами — результати з точки зору естетики та зв’язного тексту, а також демонструє відмінне просторове усвідомлення за нашими першим швидким тестуванням.

Зображення, згенероване новою моделлю Z.AI.

Компанія з Пекіна, яка минулого тижня залучила $558 мільйонів доларів під час IPO в Гонконгу, навчила модель, під назвою GLM-Image, на серверах Huawei Ascend Atlas 800T A2 з використанням фреймворку MindSpore. «Ми сподіваємося, що це може стати цінним орієнтиром для спільноти у дослідженні потенціалу внутрішніх обчислювальних потужностей», — заявила Z.AI у прес-релізі, поширеному разом із South China Morning Post.

Представляємо GLM-Image: новий етап у відкритому генерації зображень.

GLM-Image використовує гібридну архітектуру автрорегресії та дифузії, поєднуючи сильне глобальне семантичне розуміння із високою точністю візуальних деталей. Вона відповідає основним дифузійним моделям за загальною якістю… pic.twitter.com/cjtUYRkge5

— Z.ai (@Zai_org) 14 січня 2026

GLM-Image поєднує автрорегресивні та дифузійні техніки у гібридній архітектурі з 16 мільярдами параметрів. Компонент автрорегресії, заснований на мовній моделі Z.AI GLM-4, відповідає за розуміння інструкцій та композицію зображень, тоді як дифузійний декодер уточнює дрібні деталі. Цей підхід нагадує техніки, що використовуються у найновішій моделі генерації зображень OpenAI gpt-image-1.5, яка показала кращу обробку тексту та дотримання запитів у порівнянні з чистими дифузійними моделями, такими як Stable Diffusion. Дифузійні моделі створюють зображення, починаючи з випадкового візуального шуму і повільно його уточнюючи у картину, тоді як автрорегресивні моделі будують зображення крок за кроком, прогнозуючи кожну частину на основі попередніх. Дифузія чудово справляється з реалістичністю в цілому, але може мати труднощі з точними деталями, такими як текст або розкладка, тоді як автрорегресивні моделі відмінно працюють із структурою та виконанням інструкцій. Зараз дифузія — найпопулярніша техніка серед відкритих моделей для генерації зображень ШІ.

Нові гібридні системи поєднують обидва підходи, використовуючи автрорегресивне планування зображення та дифузію для доопрацювання кінцевого результату.

Зображення: Z.AI

Випуск має значення для Z.AI, яку Вашингтон внесли до чорного списку у 2025 році через нібито зв’язки з військовими Китаю. Це призвело до блокування компанії від процесорів Nvidia H100 та A100. Тепер Z.AI довела, що компанії, внесені до чорного списку, все ще можуть створювати конкурентоспроможні системи ШІ, використовуючи внутрішнє обладнання, що довго прагнула продемонструвати Пекін. Щойно після оголошення Z.AI, Reuters повідомила, що китайські митні органи наказали агентам блокувати ввіз чипів Nvidia H200 до країни. Урядові чиновники скликали зустрічі з технологічними компаніями, на яких їм наказали не купувати ці чипи, якщо це не потрібно. За словами джерел, формулювання було настільки суворим, що фактично становило «базовий заборону на даний момент».  Здається, Пекін сигналізує, що китайські лабораторії ШІ можуть створювати здатні моделі без американського кремнію, зменшуючи терміновість для китайських компаній накопичувати Nvidia-обладнання. Чип H200, який забезпечує приблизно в шість разів більшу продуктивність, ніж чип H20, який Пекін уже заборонив минулого серпня, отримав замовлення від китайських компаній на понад два мільйони одиниць за ціною $27,000 кожна. Аналітики Центру з безпеки та нових технологій Джорджтаунського університету зазначили, що стратегія Китаю щодо чипів базується на компенсації нижчої продуктивності кожного чипа за допомогою масивних кластерів процесорів Huawei. Такий підхід працює, але вимагає більше обладнання, більшої енергії та додаткових інженерних зусиль. «Одним із ключових обмежень цієї стратегії є здатність Китаю виробляти достатню кількість чипів у domestici, щоб компенсувати та наздогнати різницю у можливостях», — сказала старший аналітик Ханна Домен у CNBC у листопаді. Згідно з дорожньою картою Huawei, її чип наступного покоління у 2026 році фактично буде гіршим за поточний флагман за показниками потужності. Але такі оцінки можуть недооцінювати можливості китайських лабораторій досягати результатів через алгоритмічну ефективність, як це продемонстрував DeepSeek, тренуючи конкурентоспроможні моделі з меншим числом чипів за допомогою оптимізації GPU на рівні збірки.

Джерело: Рада з іноземних відносин

GLM-Image від Z.AI досягла провідних у галузі показників у відкритих моделях для рендерингу тексту та генерації китайських символів, згідно з технічним звітом компанії. Ті, хто не мають відповідного обладнання, також можуть спробувати її онлайн через API за ціною $0.014 за згенероване зображення або через безкоштовний простір Hugging Face, підтримуваний Z.AI. Z.AI стала першою з «китайських тигрів ШІ», групи стартапів, що створюють великі мовні моделі для конкуренції з OpenAI та Anthropic, яка вийшла на біржу. Її акції зросли приблизно на 80% з моменту лістингу, що стало результатом ентузіазму інвесторів щодо китайських компаній ШІ, таких як DeepSeek або Alibaba, на тлі внутрішніх амбіцій Китаю у сфері чипів. Між тим Huawei готується суттєво збільшити виробництво своїх процесорів Ascend цього року. Присутність компанії на виставках AI по всьому Китаю стала більш помітною, оскільки вона намагається позиціонувати себе як основний елемент національної інфраструктури ШІ, яка вже не залежить від Санта-Клари.

Переглянути оригінал
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів