NVIDIA, diretor sênior de infraestrutura de IA, Dion Harris, revelou à CNBC detalhes do desenvolvimento da nova geração do sistema de inteligência artificial Vera Rubin e sua implementação na cadeia de abastecimento global, incluindo atualizações de capacidade de processamento, adoção de padrões universais, otimização energética e investimentos na construção de infraestrutura nos EUA. Vera Rubin sucede a arquitetura Blackwell atual e se tornará o novo padrão universal para infraestrutura de IA em larga escala, integrando profundamente o design de hardware e a cadeia de abastecimento global. O mercado está otimista de que isso trará resultados sólidos para a NVIDIA.
Padrão universal da arquitetura Vera Rubin conecta cadeias de abastecimento globais
A arquitetura Blackwell atual contém cerca de 1,2 milhão de componentes, enquanto a próxima geração Vera Rubin aumentará esse número para 1,3 milhão. A NVIDIA adotará um padrão universal, com mais de 80 fornecedores e 350 fábricas ao redor do mundo adotando esse novo padrão, abrangendo Taiwan, Japão, Coreia do Sul, EUA, China, México, Israel, Vietname e Tailândia, entre mais de 20 países. Os chips principais serão produzidos pela TSMC, com a Foxconn responsável pela montagem dos chassis, enquanto fornecedores taiwaneses desempenham papel crucial.
HBM4 resolve o consumo energético de computação
Vera Rubin resolve o maior gargalo atual do desenvolvimento de IA: o consumo de energia. A nova CPU Vera oferece aproximadamente o dobro de desempenho por watt em comparação com a Grace CPU anterior. Em relação à Blackwell, que solda a memória na placa de circuito, Vera Rubin introduz um design de memória removível e substituível SoCAMM, aumentando a flexibilidade na manutenção do sistema. Para altas demandas de armazenamento, o sistema utiliza memória de alta largura de banda HBM4 fornecida pela SK Hynix e Samsung, resolvendo problemas de latência no acesso aos dados. Através do switch NVLink desenvolvido pela própria NVIDIA, a taxa de transferência de dados atinge 3,6 TB por segundo, combinada com uma rede de cabos de cobre de quase dois milhas na parte traseira do chassis, elevando significativamente o retorno de processamento por unidade de energia.
Sistema de refrigeração líquida substitui ventiladores, economizando água
Vera Rubin é o primeiro sistema de NVIDIA a adotar 100% de refrigeração líquida. Para a implantação inicial da Blackwell, alguns clientes relataram problemas de superaquecimento, mas a equipe técnica identificou que a maioria dessas falhas se devia a instalação incorreta das válvulas de líquido, e não a falhas de projeto. Atualmente, a maioria dos sistemas está operando de forma estável. A plataforma de cálculo Vera Rubin substitui completamente ventiladores, mangueiras e cabos por placas de refrigeração e um sistema de circuito fechado de água para resfriar os processadores. Embora o design de refrigeração líquida pareça consumir água, ele reduz o uso de recursos hídricos em comparação com técnicas tradicionais de resfriamento por evaporação, apresentando benefícios de economia de água.
NVIDIA investe US$ 500 bilhões na construção de infraestrutura de IA nos EUA
Apesar de a NVIDIA já possuir vantagem significativa no mercado, diante de riscos na cadeia de abastecimento, geopolítica e tarifas, a empresa está preparada para investir até US$ 500 bilhões nos EUA na construção de infraestrutura de IA, utilizando tecnologia de robótica para automação de montagem.
Clientes como Google continuam a desenvolver seus próprios chips, mantendo parceria com a NVIDIA
Concorrentes da NVIDIA, como AMD, planejam lançar o sistema Helios, uma plataforma de rack para ganhar participação de mercado. Enquanto isso, clientes principais como Microsoft, Google, Amazon e Meta continuam a desenvolver seus próprios chips, como Trainium ou TPU, mas permanecem parceiros da NVIDIA. O caminho de desenvolvimento não se limita à arquitetura Rubin; a equipe de pesquisa já apresentou um protótipo da próxima geração, Kyber, que aumenta o número de GPUs por rack de 72 para 288. O Kyber reduz significativamente a quantidade de cabos internos, aumentando a densidade de processamento em quatro vezes e adicionando cerca de 50% de peso. Essa redução de pontos de conexão e maior integração visa diminuir a taxa de falhas do sistema e alcançar comunicações de latência extremamente baixa. Vera Rubin Ultra e a arquitetura Kyber estão previstas para serem lançadas em 2026 e 2027, respectivamente. O mercado de hardware de IA está evoluindo de uma competição baseada apenas no desempenho de chips individuais para uma disputa mais ampla de integração de sistemas e resiliência na cadeia de abastecimento global, com a NVIDIA já na liderança, à frente de seus concorrentes.
Esta matéria, intitulada “Vera Rubin da NVIDIA padroniza cadeia de abastecimento global e impulsiona resultados”, foi originalmente publicada na Chain News ABMedia.