A Nvidia lança o modelo de inteligência artificial de código aberto Nemotron 3 Super de 120B, com aumento de throughput até 5 vezes

Gate News notícia, 12 de março, a NVIDIA lançou o grande modelo de linguagem de código aberto Nemotron 3 Super, projetado para aplicações multiagente. O modelo possui um total de 120 bilhões de parâmetros, usando uma arquitetura híbrida Mamba-Transformer MoE, ativando apenas 12 bilhões de parâmetros por token durante a inferência. Sua tecnologia central, “Latent MoE” (MoE Latente), comprime o embedding do token em um espaço latente de baixa classificação antes de roteá-lo para a rede de especialistas, permitindo ativar até 4 especialistas com o custo computacional de um único especialista, aumentando a taxa de processamento de inferência em até 5 vezes em relação à geração anterior, Nemotron Super. O modelo suporta nativamente uma janela de contexto de 1 milhão de tokens, ideal para agentes autônomos que precisam manter o estado do fluxo de trabalho por longos períodos. Na avaliação de carga de trabalho de agentes com o benchmark PinchBench, o Nemotron 3 Super obteve uma pontuação de 85,6%, a mais alta entre modelos de código aberto similares. A NVIDIA também lançou um conjunto de dados de treinamento com mais de 10 trilhões de tokens, 15 ambientes de treinamento de reforço e planos de avaliação, sob a licença NVIDIA Nemotron Open Model License. O modelo já está disponível nas plataformas Hugging Face, build.nvidia.com, Perplexity, OpenRouter, entre outras, e pode ser implantado via Google Cloud, Oracle, AWS Bedrock, Azure e outros provedores de nuvem. Empresas como Perplexity, CodeRabbit, Cadence, Dassault Systèmes e Siemens já adotaram o modelo.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário