Статья: Haotian
На форуме в Давосе, что же на самом деле сказал Хуанг Жэньсюнь?
На первый взгляд, он занимается продвижением роботов, на самом деле же он ведет смелую «самую революцию». Он одним выступлением положил конец эпохе «накапливания видеокарт», но неожиданно для всех подготовил уникальный шанс для входа в Crypto-сектор?
Вчера, на Давосском форуме, старший вице-президент NVIDIA отметил, что слой приложений ИИ переживает бум, и потребность в вычислительных мощностях полностью смещается с «обучения» на «вывод» и «Physical AI (физический ИИ)».
Это очень интересно.
NVIDIA, как крупнейший победитель в эпоху «гонки за вычислительными мощностями» AI 1.0, сейчас активно заявляет о смене фокуса на «вывод» и «Physical AI», что на самом деле посылает очень ясный сигнал: эпоха «чем больше видеокарт — тем больше чудес» для обучения больших моделей прошла, и в будущем конкуренция в AI будет строиться вокруг внедрения приложений и «приложений как короля».
Другими словами, Physical AI — это вторая половина Generative AI.
Потому что LLM уже освоили все данные, накопленные человечеством за десятилетия в интернете, но они все равно не умеют, например, как человек, открутить крышку бутылки. Physical AI — это решение проблемы «знание и действие в единстве», выход за рамки интеллектуальных возможностей AI.
Потому что физический AI не может полагаться на «длинную цепочку отражений» удаленного облачного сервера, логика очень проста: если ChatGPT генерирует текст с задержкой в одну секунду, вы почувствуете задержку, а если двухногий робот из-за сетевой задержки упадет со ступенек, последствия могут быть очень серьезными.
Однако, Physical AI кажется продолжением генеративного AI, на самом деле он сталкивается с тремя совершенно новыми задачами:
Профессор Ли Фэйфэй предложил, что пространственный интеллект — это следующая северная звезда эволюции AI. Роботу нужно сначала «понять» окружающую среду. Это не просто распознать «это стул», а понять «где в трехмерном пространстве находится этот стул, его структура и с какой силой его нужно переместить».
Для этого нужны огромные объемы данных о 3D-среде, собираемых в реальном времени, охватывающих все уголки внутри и снаружи.
Omniverse, о котором говорил Хуанг Жэньсюнь, — это именно «виртуальная тренировочная площадка». Перед тем как попасть в реальный физический мир, робот должен пройти обучение «упасть десять тысяч раз» в виртуальной среде, чтобы научиться ходить. Этот процесс называется Sim-to-Real, то есть переход от симуляции к реальности. Если позволить роботу учиться на ошибках прямо в реальности, стоимость аппаратного обеспечения будет астрономической.
Этот процесс требует колоссальной пропускной способности физического движка для моделирования и рендеринга.
Чтобы Physical AI мог ощущать «на ощупь», ему нужна электронная кожа для восприятия температуры, давления, текстуры. Эти «тактильные данные» — это новые активы, которые ранее никогда не собирались в масштабах. Для этого нужны массовые сенсоры; на выставке CES компания Ensuring показала «массовую кожу», в которой на руке встроено 1956 сенсоров, что позволяет роботу, например, аккуратно разбивать яйца.
Эти «тактильные данные» — это новые активы, ранее не собиравшиеся в масштабах.
Посмотрев на все это, вы наверняка почувствуете, что появление концепции Physical AI дает огромные возможности для развития таких устройств, как носимые гаджеты и гуманоидные роботы, ведь раньше эти устройства считались «большими игрушками».
На самом деле, я хочу сказать, что в новой карте Physical AI сектор Crypto тоже имеет отличные шансы на интеграцию. Вот несколько примеров:
Гиганты AI могут отправлять уличные автомобили для сканирования каждого главного проспекта, но не смогут собрать данные о закоулках улиц, жилых комплексов и подвалов. Используя стимулирование через токены в сети DePIN, можно мотивировать пользователей по всему миру использовать свои устройства для дополнения этих данных, что может привести к полноценному заполнению пробелов.
Как уже говорилось, роботы не могут полагаться на облачные вычисления, но в краткосрочной перспективе можно масштабировать использование периферийных вычислений и распределенной рендеринг-системы, особенно для обработки данных из симуляций и перехода к реальности. Объединив неиспользуемое потребительское оборудование в распределенную сеть, можно эффективно его задействовать.
«Тактильные данные» — помимо масштабных сенсоров, эти данные вызывают вопросы конфиденциальности. Как мотивировать людей делиться такими чувствительными данными с гигантами AI? Решение — дать участникам право на подтверждение владения данными и их получение части дохода.
Итог:
Physical AI — это вторая половина эпохи web 2 AI, которую провозгласил Хуанг Жэньсюнь. А что насчет сектора web 3 AI + Crypto, таких как DePIN, DeAI, DeData? Разве они не тоже в этом контексте? Что думаете?