A CEO da NVIDIA, Jensen Huang, anunciou na GTC 2026 a “demanda de pelo menos 1 trilhão de dólares até 2027”, e usou fábricas de tokens, o sistema CUDA, o sistema monstruoso Vera Rubin, o sistema operacional de agentes OpenClaw para traçar o plano da próxima década da NVIDIA.
(Resumindo: Jensen Huang na GTC falou sobre “DLSS 5, NemoClaw” e acendeu a chama da IA: FET subiu 20%, NEAR, Worldcoin atingiram máximos recentes)
(Complemento: O Ministério da Segurança Nacional da China alertou sobre “criação de lagostas”: OpenClaw tem quatro minas terrestres de segurança, seu dispositivo pode ser invadido)
Índice do artigo
Alternar
Em 16 de março de 2026, a NVIDIA abriu sua conferência GTC, e Jensen Huang subiu ao palco e disse uma frase que silenciou a audiência: “No ano passado, falei de uma demanda de 500 bilhões de dólares com alta confiança. Agora, neste exato momento, vejo um número de pelo menos 1 trilhão de dólares. E tenho certeza de que a demanda real é ainda maior.”
Ao dizer isso, o preço das ações da NVIDIA subiu mais de 4,3% no mesmo dia. Mas Jensen Huang não estava apenas reportando números; passou toda a palestra explicando de onde vinha esse 1 trilhão de dólares e por que ainda não era suficiente.
O ponto de partida da palestra foi a especialidade da NVIDIA — CUDA. Este ano marca o 20º aniversário do CUDA, e Jensen Huang o descreveu como a “lógica estratégica de 100%” da NVIDIA.
Resumindo: CUDA é a tecnologia que permite aos desenvolvedores programar GPUs. Quando surgiu há vinte anos, ninguém tinha certeza do sucesso, mas a NVIDIA investiu grande parte de seus recursos para sustentá-lo. Agora, olhando para trás, essa decisão criou uma barreira quase inimitável — bilhões de GPUs rodando CUDA ao redor do mundo, dezenas de milhares de projetos open source dependentes dele, e todos os provedores de nuvem integrando essa tecnologia.
Jensen Huang chama isso de “volante”: grande volume de máquinas → atrai desenvolvedores → eles criam novos algoritmos → avanços nos algoritmos abrem novos mercados → expansão do mercado aumenta o volume de máquinas → o volante continua girando. Ainda melhor, a NVIDIA continua otimizando o software; por exemplo, a arquitetura Ampere, de seis anos atrás, ainda tem preços de aluguel na nuvem que sobem — porque mais aplicações estão rodando nela, e elas valem cada vez mais.
Este é o conceito central da palestra de Jensen Huang, e a lógica-chave para explicar a demanda de 1 trilhão de dólares.
Simplificando: no passado, data centers eram “depósitos”, usados para guardar arquivos e dados; no futuro, serão “fábricas”, produzindo a unidade básica de IA — tokens (que podem ser entendidos como as menores unidades de pensamento e fala da IA).
Jensen Huang diz que cada data center é limitado pela energia: uma instalação de 1 GW (gigawatt) nunca se tornará de 2 GW, isso é uma lei física. Então, a questão central da competição é: com a mesma energia, quem consegue produzir mais tokens? Quem tem maior throughput de tokens por watt, quem tem menor custo de produção, vence.
Tokens terão preços por camadas, como classe executiva e econômica:
Em outras palavras, com uma GPU, Jensen Huang recomenda distribuir sua potência entre diferentes níveis de serviço — quanto maior o throughput e mais rápida a velocidade, maior o lucro. Ele estima que, em relação à geração Hopper, o novo sistema Grace Blackwell pode gerar até 5 vezes mais receita com a mesma potência.
Jensen Huang diz que, ao falar da geração Hopper, poderia mostrar uma única peça de chip; mas, ao falar de Vera Rubin, pensa-se no sistema completo.
Dados: em um data center de 1 GW, a taxa de geração de tokens passou de 22 milhões por segundo para 700 milhões por segundo, um aumento de 350 vezes em dois anos. Em comparação, a Lei de Moore só traz cerca de 1,5 vezes de aumento no mesmo período.
Como é esse sistema monstruoso? Vera Rubin é totalmente líquido, elimina cabos tradicionais, e um rack que levava dois dias para ser instalado agora leva duas horas. Microsoft Azure confirmou que seu primeiro rack Vera Rubin está em operação.
A integração da tecnologia da Groq não visa substituir as GPUs próprias, mas fazer “inferência assimétrica” — ou seja, dividir a inferência de IA em duas etapas, usando a ferramenta mais adequada para cada uma.
A chip da Groq tem muita SRAM de alta velocidade (500MB), muito rápida, mas pouca memória, ideal para a etapa final de geração de tokens. A Vera Rubin tem muita memória (288GB), adequada para cálculos iniciais em grande escala e cache.
A NVIDIA usa o software Dynamo para conectar as duas: a “pré-carregamento” e o mecanismo de atenção na decodificação ficam na Vera Rubin, enquanto a geração de tokens sensível à latência fica na Groq. As duas se conectam por Ethernet, reduzindo a latência geral em cerca de 50%.
Jensen Huang também recomenda: se o trabalho for principalmente de alto throughput, use 100% Vera Rubin; se precisar de geração de código de alto valor, reserve cerca de 25% do data center para Groq. Os chips LP30 da Groq, fabricados pela Samsung, começarão a ser entregues no terceiro trimestre.
Jensen Huang diz que, há dez anos, a GeForce trouxe IA para o mundo todo; agora, a IA está remodelando a computação gráfica. Ele chama essa nova tecnologia de “Neural Rendering” (Renderização Neural), ou seja, DLSS 5.
A ideia central é combinar gráficos 3D determinísticos (com estrutura clara e controle preciso) com a estética probabilística da IA generativa. Dados estruturados garantem controle, enquanto a IA torna a imagem mais bonita do que a realidade. Jensen Huang afirma que essa fusão de “dados estruturados + IA generativa” será repetida em várias indústrias.
Peter Steinberger criou o OpenClaw, que Jensen Huang chama de “o projeto open source mais popular da história, que em semanas superou os 30 anos de conquistas do Linux”.
O que é o OpenClaw? Em linguagem simples: permite que agentes de IA gerenciem recursos, chamem ferramentas, leiam e escrevam arquivos, executem tarefas agendadas e dividam grandes problemas em tarefas menores, distribuídas a sub-agentes — como um sistema operacional que faz os programas rodarem no computador, mas para IA em ambientes empresariais.
Jensen Huang diz: “Cada SaaS será uma AaaS.” Ou seja, empresas de software não venderão mais apenas ferramentas, mas serviços de agentes de IA que fazem o trabalho por você.
Porém, há um desafio: esses agentes podem acessar dados sensíveis e executar códigos, o que precisa de controle rigoroso no ambiente corporativo. Para isso, a NVIDIA lançou o NeMo Claw, uma referência empresarial com mecanismos de estratégia e roteadores de privacidade, garantindo a implementação segura dos agentes na empresa.
Jensen Huang faz uma previsão concreta: “No futuro, cada engenheiro na empresa precisará de um orçamento anual de tokens. Eles terão um salário de dezenas de milhares de dólares, e eu lhes darei uma cota de tokens equivalente a metade do salário, para multiplicar por 10 sua produtividade.”
Ele afirma que isso não é uma metáfora, mas uma métrica de competitividade futura: quanto mais tokens você fornecer a um engenheiro, mais valor ele poderá criar. Cada empresa será tanto consumidora quanto produtora de tokens.
Jensen Huang diz que as inteligências digitais atuam no mundo digital, enquanto a IA física é a inteligência incorporada — ou seja, robôs.
Na GTC deste ano, foram apresentados 110 robôs, abrangendo quase todas as empresas de pesquisa e desenvolvimento de robótica do mundo.
Na direção de veículos autônomos, Jensen Huang anunciou que BYD, Hyundai, Nissan e Geely se juntaram à plataforma RoboTaxi Ready da NVIDIA, com uma produção anual combinada de 18 milhões de veículos, além de Mercedes-Benz, Toyota e GM. A NVIDIA também anunciou parceria com Uber para implantar e integrar veículos RoboTaxi em várias cidades.
Na parte final, o robô Olaf, da Disney, subiu ao palco, usando o chip Jetson como cérebro, aprendendo a andar no Omniverse, e usando o Newton para simular a física do mundo real. Jensen Huang brincou: “Achei que fosse mais alto. Nunca vi um boneco de neve tão baixo.”
No encerramento, Jensen Huang revelou a próxima arquitetura de computação, Feynman, que suportará por primeira vez cabos de cobre e fibra óptica em uma mesma plataforma, com expansão horizontal.
Mais além, imagina-se o “Vera Rubin Space-1” — um data center no espaço, levando o poder de computação de IA além da Terra.
Jensen Huang resumiu a palestra em quatro pontos: o ponto de inflexão na inferência, a era das fábricas de IA, a revolução dos agentes OpenClaw, a implementação em escala da IA física. E 1 trilhão de dólares é apenas o começo.