Discurso completo de Jensen Huang na GTC2026: A procura de IA atinge biliões de dólares, a potência computacional salta 350 vezes, OpenClaw permite que cada empresa se torne AaaS

動區BlockTempo

2026-03-17 06:02:42

FET14,62%

A CEO da NVIDIA, Jensen Huang, anunciou na GTC 2026 a “demanda de pelo menos 1 trilhão de dólares até 2027”, e usou fábricas de tokens, o sistema CUDA, o sistema monstruoso Vera Rubin, o sistema operacional de agentes OpenClaw para traçar o plano da próxima década da NVIDIA.
(Resumindo: Jensen Huang na GTC falou sobre “DLSS 5, NemoClaw” e acendeu a chama da IA: FET subiu 20%, NEAR, Worldcoin atingiram máximos recentes)
(Complemento: O Ministério da Segurança Nacional da China alertou sobre “criação de lagostas”: OpenClaw tem quatro minas terrestres de segurança, seu dispositivo pode ser invadido)

Índice do artigo

Alternar

Abertura: o efeito de volante de vinte anos do CUDA
Economia da fábrica de tokens: data centers deixam de armazenar arquivos e passam a produzir tokens
Vera Rubin: 350 vezes em dois anos, isso não é a Lei de Moore, é uma curva diferente
Verdadeira intenção da aquisição da Groq: tornar o rápido mais rápido, o caro mais caro
DLSS 5: a era da computação gráfica chega ao seu momento GPT
OpenClaw: o sistema operacional da era dos agentes inteligentes
O futuro de cada engenheiro com orçamento de tokens
IA física e exército de robôs
Próxima geração: arquitetura Feynman + data center espacial

Em 16 de março de 2026, a NVIDIA abriu sua conferência GTC, e Jensen Huang subiu ao palco e disse uma frase que silenciou a audiência: “No ano passado, falei de uma demanda de 500 bilhões de dólares com alta confiança. Agora, neste exato momento, vejo um número de pelo menos 1 trilhão de dólares. E tenho certeza de que a demanda real é ainda maior.”

Ao dizer isso, o preço das ações da NVIDIA subiu mais de 4,3% no mesmo dia. Mas Jensen Huang não estava apenas reportando números; passou toda a palestra explicando de onde vinha esse 1 trilhão de dólares e por que ainda não era suficiente.

Abertura: o efeito de volante de vinte anos do CUDA

O ponto de partida da palestra foi a especialidade da NVIDIA — CUDA. Este ano marca o 20º aniversário do CUDA, e Jensen Huang o descreveu como a “lógica estratégica de 100%” da NVIDIA.

Resumindo: CUDA é a tecnologia que permite aos desenvolvedores programar GPUs. Quando surgiu há vinte anos, ninguém tinha certeza do sucesso, mas a NVIDIA investiu grande parte de seus recursos para sustentá-lo. Agora, olhando para trás, essa decisão criou uma barreira quase inimitável — bilhões de GPUs rodando CUDA ao redor do mundo, dezenas de milhares de projetos open source dependentes dele, e todos os provedores de nuvem integrando essa tecnologia.

Jensen Huang chama isso de “volante”: grande volume de máquinas → atrai desenvolvedores → eles criam novos algoritmos → avanços nos algoritmos abrem novos mercados → expansão do mercado aumenta o volume de máquinas → o volante continua girando. Ainda melhor, a NVIDIA continua otimizando o software; por exemplo, a arquitetura Ampere, de seis anos atrás, ainda tem preços de aluguel na nuvem que sobem — porque mais aplicações estão rodando nela, e elas valem cada vez mais.

Economia da fábrica de tokens: data centers deixam de armazenar arquivos e passam a produzir tokens

Este é o conceito central da palestra de Jensen Huang, e a lógica-chave para explicar a demanda de 1 trilhão de dólares.

Simplificando: no passado, data centers eram “depósitos”, usados para guardar arquivos e dados; no futuro, serão “fábricas”, produzindo a unidade básica de IA — tokens (que podem ser entendidos como as menores unidades de pensamento e fala da IA).

Jensen Huang diz que cada data center é limitado pela energia: uma instalação de 1 GW (gigawatt) nunca se tornará de 2 GW, isso é uma lei física. Então, a questão central da competição é: com a mesma energia, quem consegue produzir mais tokens? Quem tem maior throughput de tokens por watt, quem tem menor custo de produção, vence.

Tokens terão preços por camadas, como classe executiva e econômica:

Camada gratuita (alto throughput, baixa velocidade)
Camada intermediária (cerca de 3 dólares por milhão de tokens)
Camada avançada (cerca de 6 dólares por milhão de tokens)
Camada de alta velocidade (cerca de 45 dólares por milhão de tokens)
Camada ultrarrápida (cerca de 150 dólares por milhão de tokens)

Em outras palavras, com uma GPU, Jensen Huang recomenda distribuir sua potência entre diferentes níveis de serviço — quanto maior o throughput e mais rápida a velocidade, maior o lucro. Ele estima que, em relação à geração Hopper, o novo sistema Grace Blackwell pode gerar até 5 vezes mais receita com a mesma potência.

Vera Rubin: 350 vezes em dois anos, isso não é a Lei de Moore, é uma curva diferente

Jensen Huang diz que, ao falar da geração Hopper, poderia mostrar uma única peça de chip; mas, ao falar de Vera Rubin, pensa-se no sistema completo.

Dados: em um data center de 1 GW, a taxa de geração de tokens passou de 22 milhões por segundo para 700 milhões por segundo, um aumento de 350 vezes em dois anos. Em comparação, a Lei de Moore só traz cerca de 1,5 vezes de aumento no mesmo período.

Como é esse sistema monstruoso? Vera Rubin é totalmente líquido, elimina cabos tradicionais, e um rack que levava dois dias para ser instalado agora leva duas horas. Microsoft Azure confirmou que seu primeiro rack Vera Rubin está em operação.

Verdadeira intenção da aquisição da Groq: tornar o rápido mais rápido, o caro mais caro

A integração da tecnologia da Groq não visa substituir as GPUs próprias, mas fazer “inferência assimétrica” — ou seja, dividir a inferência de IA em duas etapas, usando a ferramenta mais adequada para cada uma.

A chip da Groq tem muita SRAM de alta velocidade (500MB), muito rápida, mas pouca memória, ideal para a etapa final de geração de tokens. A Vera Rubin tem muita memória (288GB), adequada para cálculos iniciais em grande escala e cache.

A NVIDIA usa o software Dynamo para conectar as duas: a “pré-carregamento” e o mecanismo de atenção na decodificação ficam na Vera Rubin, enquanto a geração de tokens sensível à latência fica na Groq. As duas se conectam por Ethernet, reduzindo a latência geral em cerca de 50%.

Jensen Huang também recomenda: se o trabalho for principalmente de alto throughput, use 100% Vera Rubin; se precisar de geração de código de alto valor, reserve cerca de 25% do data center para Groq. Os chips LP30 da Groq, fabricados pela Samsung, começarão a ser entregues no terceiro trimestre.

DLSS 5: a era da computação gráfica chega ao seu momento GPT

Jensen Huang diz que, há dez anos, a GeForce trouxe IA para o mundo todo; agora, a IA está remodelando a computação gráfica. Ele chama essa nova tecnologia de “Neural Rendering” (Renderização Neural), ou seja, DLSS 5.

A ideia central é combinar gráficos 3D determinísticos (com estrutura clara e controle preciso) com a estética probabilística da IA generativa. Dados estruturados garantem controle, enquanto a IA torna a imagem mais bonita do que a realidade. Jensen Huang afirma que essa fusão de “dados estruturados + IA generativa” será repetida em várias indústrias.

OpenClaw: o sistema operacional da era dos agentes inteligentes

Peter Steinberger criou o OpenClaw, que Jensen Huang chama de “o projeto open source mais popular da história, que em semanas superou os 30 anos de conquistas do Linux”.

O que é o OpenClaw? Em linguagem simples: permite que agentes de IA gerenciem recursos, chamem ferramentas, leiam e escrevam arquivos, executem tarefas agendadas e dividam grandes problemas em tarefas menores, distribuídas a sub-agentes — como um sistema operacional que faz os programas rodarem no computador, mas para IA em ambientes empresariais.

Jensen Huang diz: “Cada SaaS será uma AaaS.” Ou seja, empresas de software não venderão mais apenas ferramentas, mas serviços de agentes de IA que fazem o trabalho por você.

Porém, há um desafio: esses agentes podem acessar dados sensíveis e executar códigos, o que precisa de controle rigoroso no ambiente corporativo. Para isso, a NVIDIA lançou o NeMo Claw, uma referência empresarial com mecanismos de estratégia e roteadores de privacidade, garantindo a implementação segura dos agentes na empresa.

Cada engenheiro terá um orçamento de tokens no futuro

Jensen Huang faz uma previsão concreta: “No futuro, cada engenheiro na empresa precisará de um orçamento anual de tokens. Eles terão um salário de dezenas de milhares de dólares, e eu lhes darei uma cota de tokens equivalente a metade do salário, para multiplicar por 10 sua produtividade.”

Ele afirma que isso não é uma metáfora, mas uma métrica de competitividade futura: quanto mais tokens você fornecer a um engenheiro, mais valor ele poderá criar. Cada empresa será tanto consumidora quanto produtora de tokens.

IA física e exército de robôs

Jensen Huang diz que as inteligências digitais atuam no mundo digital, enquanto a IA física é a inteligência incorporada — ou seja, robôs.

Na GTC deste ano, foram apresentados 110 robôs, abrangendo quase todas as empresas de pesquisa e desenvolvimento de robótica do mundo.

Na direção de veículos autônomos, Jensen Huang anunciou que BYD, Hyundai, Nissan e Geely se juntaram à plataforma RoboTaxi Ready da NVIDIA, com uma produção anual combinada de 18 milhões de veículos, além de Mercedes-Benz, Toyota e GM. A NVIDIA também anunciou parceria com Uber para implantar e integrar veículos RoboTaxi em várias cidades.

Na parte final, o robô Olaf, da Disney, subiu ao palco, usando o chip Jetson como cérebro, aprendendo a andar no Omniverse, e usando o Newton para simular a física do mundo real. Jensen Huang brincou: “Achei que fosse mais alto. Nunca vi um boneco de neve tão baixo.”

Próxima geração: arquitetura Feynman + data center espacial

No encerramento, Jensen Huang revelou a próxima arquitetura de computação, Feynman, que suportará por primeira vez cabos de cobre e fibra óptica em uma mesma plataforma, com expansão horizontal.

Mais além, imagina-se o “Vera Rubin Space-1” — um data center no espaço, levando o poder de computação de IA além da Terra.

Jensen Huang resumiu a palestra em quatro pontos: o ponto de inflexão na inferência, a era das fábricas de IA, a revolução dos agentes OpenClaw, a implementação em escala da IA física. E 1 trilhão de dólares é apenas o começo.

Ver original

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Comentar

0/400

Nenhum comentário