NVIDIA и Alibaba переоценивают AI, выбрасывают FLOPS "в мусорку"

17 марта на сцене NVIDIA GTC 2026 Хуанг Жэньсюнь в своей фирменной кожаной куртке говорил более двух часов. После мероприятия почти вся сеть обсуждала: «NVIDIA станет королём Token».

Но если внимательно слушать его речь, обнаружишь, что Хуанг Жэньсюнь действительно неоднократно подчеркивает не сам Token, а Tokens per Watt (количество токенов на ватт). Он ясно указал этот концепт при демонстрации графиков производительности inference и прямо заявил: каждая дата-центра, каждая AI-ферма по сути ограничены электроэнергией. Фабрика мощностью 1 ГВт никогда не станет 2 ГВт — это физический закон. При фиксированной мощности тот, у кого самый высокий выход токенов на ватт, имеет самые низкие издержки производства, а его кривая доходов — самую крутую.

Именно эта фраза — главный смысл всей презентации GTC 2026.

Общественность активно обсуждает, насколько Vera Rubin превосходит Blackwell, как Groq LPX может увеличить скорость inference на 35 раз, и как NVIDIA планирует перенести дата-центры в космос. Всё это важно, но по сути — разные выражения одного и того же логического подхода: при ограничениях по энергии максимизировать интеллектуальный выход на каждый ватт.

Когда Хуанг Жэньсюнь делает Tokens/W ключевым показателем для оценки AI-фермы, за этим стоит более глубокий индустриальный смысл: система измерения вычислительной мощности, которая переходит от чипов к системам, от пиковых параметров к полной энергоэффективности, от скорости чипа к тому, как эффективно энергия превращается в интеллект.

В текущей продуктовой и технологической матрице NVIDIA и Хуанг Жэньсюнь всё ещё ограничены показателем token/w, и для достижения статуса настоящего короля токенов им ещё предстоит сделать много шагов.

Это — переход к «языку интеллектуальных измерений». И этот переход открывает новые индустриальные перспективы, которые гораздо важнее, чем любой новый чип.

Совпадение: за день до официального открытия GTC Alibaba объявила о создании Alibaba Token Hub, возглавляемого Ву Юймином. В центре внимания — не просто AI, а Token, поднятый до стратегического уровня Alibaba, что означает его интеграцию в стратегию компании.

Это ещё один пример того, что системный взгляд на AI постепенно становится новой отраслевой парадигмой. Именно это и подчеркивает эта статья — её главная идея.

01 Самое важное изменение GTC 2026 — не в чипах

На GTC 2026 все снова обсуждают Vera Rubin, Rubin POD, LPX, DSX AI Factory и новые термины. Но если рассматривать эти анонсы вместе, становится ясно, что границы конкуренции в вычислительной мощности смещаются с отдельных чипов на инфраструктурный уровень — целую систему, состоящую из вычислений, сети, хранения, электроснабжения, охлаждения, систем управления и программного обеспечения — так называемую AI-ферму.

Rubin описывается как POD-платформа, объединяющая несколько стоек в крупную, согласованную систему; DSX — как эталонный дизайн для AI-фермы, ориентированный на максимизацию Tokens/W.

Это означает, что настоящая конкуренция смещается с вопроса «насколько быстрый чип» к вопросу «насколько мощная вся система». Более того, речь идет о том, сможет ли вся система эффективно организовать ограниченные ресурсы — электроэнергию, охлаждение и сеть — для стабильного производства AI-результатов.

Конкретный показатель — Tokens/W.

Эта статья использует метрику Tokens/W, чтобы понять смысл этих нововведений и выявить возможности для развития индустрии AI-инфраструктуры.

02 Когда конкуренция переходит к системам, метрики должны меняться

Метрики эпохи чипов — хорошо известны: пиковая производительность в FLOPS, пропускная способность памяти, FLOPS/W, TOPS/W, бит/J. Все они важны, потому что описывают границы возможностей компонента.

Но на практике возникает проблема: в центрах интеллектуальных вычислений нет единой, объективной и универсальной метрики.

Обычно для оценки дата-центров используют MW — мощность в мегаваттах. В Китае при создании AI-центров используют PFlops (на базе FP16). Но даже при одинаковых показателях мощности или энергии эффективность сильно различается в зависимости от внутренней архитектуры: чипов, сети, системы охлаждения.

Причина проста: предыдущие метрики измеряли только отдельные аспекты. Пиковая производительность — сколько теоретически может сделать чип; бит/J — эффективность локальной передачи данных; пропускная способность — способность системы передавать информацию внутри подсистемы. Все это — компоненты оценки на уровне чипа.

Но финальный вопрос системы — сколько эффективных AI-выводов она может получить при заданных ограничениях по мощности, охлаждению и помещению. Этот вопрос нельзя ответить только метриками уровня чипа.

Из речи NVIDIA видно, что важны такие показатели, как: cost per token (стоимость за токен), throughput на ватт, performance на ватт, Tokens/W.

Язык измерений переходит от компонентов к системам.

Если раньше метрики — пиковая производительность, пропускная способность, бит/J, — то на системном уровне более логично использовать Tokens/W. Первые — для оценки отдельных компонентов, второе — для оценки всей системы. Первое — локальный оптимум, второе — глобальный.

03 Tokens/W соединяет энергию и интеллектуальный выход

В стенограмме GTC 2026 NVIDIA называет токен «базовой единицей современного AI». Это очень точное определение. Для больших языковых моделей, inference-сервисов, агентных систем — именно способность системы генерировать и обрабатывать токены определяет ценность.

С точки зрения бизнеса, у токена есть три преимущества: 1) он напрямую связан с inference-процессом; 2) он напрямую связан с доходами; 3) он подходит для новых нагрузок эпохи inference.

Агентные системы, многократные диалоги, длинные контексты, расширение поиска, вызовы инструментов, цепочки inference — все эти новые сценарии трудно описать только FLOPS, но они оставляют следы в метриках токенов, задержек и throughput.

Что важнее — сегодня базовые ограничения инфраструктуры всё больше проявляются как энергетические. Согласно отчету IEA «Energy and AI», к 2030 году глобальное потребление электроэнергии дата-центров достигнет около 945 ТВтч — рост значительно, и AI — один из главных драйверов этого роста, особенно в США. Иными словами, многие проблемы AI — не только вопрос чипов, а в первую очередь — электроснабжения, охлаждения и инфраструктуры.

Концепция Tokens/W ценна тем, что соединяет самую важную цепочку AI-индустрии: вход энергии, вычисления, сеть, хранение, управление охлаждением — и конечный результат — токен.

Это не просто замена FLOPS/W или бит/J. Это — слой, который раньше игнорировался: сколько энергии превращается в интеллект.

Я считаю, что самое важное в GTC — именно здесь: нельзя рассматривать чипы изолированно, нужно видеть их в системе, а систему — в рамках индустриальных ограничений.

Это — подход, который я постоянно пропагандирую. Оценка AI-чипов должна учитывать не только пиковую мощность, объем памяти и интерфейсы, но и их взаимодействие в сети, размещение в стойках, электроснабжение в парках, структуру затрат у клиентов и, в конечном итоге, реальный бизнес-выход.

GTC 2026 в определенной степени подтвердил этот системный взгляд. Когда NVIDIA сама начала фокусировать повествование на AI-фермах, индустрия уже движется от центра внимания на AI-чипы к системам.

Это — очень важный момент. Многие отрасли вначале сосредотачиваются на параметрах компонентов, потому что их легко измерить и рекламировать. Но при масштабных внедрениях решающую роль играет системная организация. Сегодня AI-инфраструктура уже достигла этого уровня.

04 Важность оптоволоконных технологий возрастет при переходе к системным метрикам

Когда метрики переходят на системный уровень, возрастает значение вспомогательных элементов.

Одним из таких — оптоволоконные соединения.

Ранее в отрасли использовались только параметры оптоволоконных модулей, коммуникаций и устройств: более высокая пропускная способность, дальность передачи, меньшая энергия на бит, лучшая плотность полосы пропускания, меньшие вставочные потери. Всё это важно, но эти оценки оставались на уровне компонентов и чипов. В рамках Tokens/W ценность оптоволоконных связей становится более очевидной: они снижают энергоемкость передачи данных и повышают способность больших AI-систем превращать электроэнергию в токены.

При описании продуктов NVIDIA по оптоволоконным сетям, использование фотонных CPO позволяет достигать до 5-кратной эффективности по сравнению с модульными решениями, снижая задержки и расширяя масштаб AI-ферм.

Главное — не только более продвинутые каналы, а более крупные системы и их высокая энергоэффективность.

С точки зрения индустрии, это логично: по мере роста моделей, увеличения длины контекстов и масштабов кластеров, большая часть энергопотребления приходится не на вычислительные блоки, а на передачу данных — между чипами, платами, стойками и POD.

На этом этапе повышение Tokens/W требует не только более мощных GPU, но и более эффективных соединений.

Поэтому развитие оптоволоконных технологий — не просто тренд, а необходимость для больших AI-систем.

05 Фото-вычисления — более передовая технология, чем оптоволоконные соединения, но логика уже складывается

Фото-вычисления — более ранняя технология, чем оптоволоконные связи, и это нужно признать.

Проблемы универсальности, точности, компиляции, производства и системной интеграции всё ещё решаются. Но если смотреть на это с системной точки зрения, её индустриальный смысл становится яснее.

Дело в том, что Tokens/W заботится о полной энергоэффективности. Кто сможет на высокочастотных, плотных, повторяемых вычислительных путях значительно снизить энергопотребление, тот сможет повысить эффективность токенов на системе в целом. Этот подход не требует, чтобы фото-вычисления полностью заменили GPU или сразу стали универсальной платформой.

Он требует лишь одного: в ключевых нагрузках снизить J/токен всей системы и увеличить выход токенов при фиксированном бюджете по мощности.

Именно поэтому концепция фото-вычислений должна сместиться с оценки отдельных устройств к оценке системной энергоэффективности. Если в отрасли всё сводится к TOPS/W или MAC/J, это — скорее лабораторные истории. Но если начать смотреть на Tokens/W, появляется шанс участвовать в инфраструктурных дискуссиях.

Это особенно важно для фото-вычислений, потому что именно здесь появляется язык, позволяющий говорить с заказчиками, парками, электросетями, инвесторами.

06 Когда метрики вычислительной мощности переходят от чипов к системам, оптоволоконные и фото-вычислительные технологии выходят на главный сценический уровень

Когда конкуренция в вычислительной мощности остаётся на уровне чипов, оптоволоконные соединения — это скорее I/O-технологии, а фото-вычисления — передовые разработки устройств.

Но когда борьба смещается на инфраструктуру больших AI-систем, всё меняется. Энергоэффективность всё больше зависит от плотности вычислений, передачи данных, управления контекстами, межузлового взаимодействия, организации электроснабжения и теплоотвода — именно в этих областях оптические технологии имеют наибольший потенциал.

С точки зрения Tokens/W, оптоволоконные связи решают проблему энергозатрат на транспортировку каждого токена; фото-вычисления — часть вычислительных затрат на каждый токен. Вместе они повышают общую эффективность системы.

Это — причина их выхода на индустриальный уровень.

Более того, помимо мощностей и поставок чипов, будущие ограничения дата-центров и AI-ферм будут включать подключение к электросетям, охлаждение, энергопотребление в парках, плотность мощности в стойках и скорость запуска. Недавние оценки IEA и заявления NVIDIA о будущем AI-инфраструктуры указывают на одно: AI-инфраструктура превращается в системный проект, где энергия — главный ресурс.

С этой новой перспективы, оптоволоконные и фото-вычислительные технологии решают те задачи, которые всё сложнее оптимизировать традиционными электрическими путями: энергоемкость передачи данных и энергоэффективность высокоплотных вычислений.

За этим стоит более целостное системное мышление. И именно поэтому GTC 2026 вновь делает акцент на фотонных и силиконовых оптических технологиях:

Когда метрики переходят к системному уровню, оптические технологии превращаются из передовых решений в инфраструктурные основы.

В этом смысле, CPO и фото-вычисления — очень перспективные направления.

Заключение: драйвер развития AGI

Автор постоянно выступает за объективные, измеряемые стандарты оценки вычислительной мощности и использует метрику Tokens/W для тестирования различных чипов.

Исторически, когда у внутреннего сгорания увеличивается соотношение мощности к весу, появляется автомобиль, самолет, ракета.

В эпоху AI, когда результат системы (сейчас — токен) всё больше соотносится с энергопотреблением, интеллект становится всё умнее, и появляется возможность создать AGI.

Главное, что стоит запомнить с GTC 2026 — это новая, ясная система измерений. Не только для NVIDIA, а для всей индустрии.

Более того, NVIDIA, Alibaba и многие крупные игроки уже начинают смотреть на развитие AI с системной точки зрения.

Это — согласуется с основным направлением развития человеческой цивилизации: использовать меньше энергии для сбора, передачи и обработки всё большего объема информации.

И AGI — не исключение!

Источник: Tencent Tech

Риск и отказ от ответственности

Рынок — рискован, инвестировать нужно осторожно. Настоящий материал не является индивидуальной инвестиционной рекомендацией и не учитывает ваши личные цели, финансовое положение или потребности. Перед инвестированием подумайте, соответствуют ли приведённые мнения и выводы вашей ситуации. Ответственность за инвестиции — только ваша.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить