Modelos da OpenAI para Migrar Gradualmente para o Chip Personalizado Trainium da Amazon, Diz Altman Ele Está 'Ansioso' por Isso

Mensagem do Gate News, 29 de abril — Modelos da OpenAI executados no Amazon Web Services’ Bedrock irão migrar gradualmente para o Trainium, o chip de IA personalizado da Amazon, de acordo com comentários recentes do CEO da OpenAI, Sam Altman, e de executivos da AWS. Atualmente, os modelos operam em um ambiente misto usando tanto GPUs quanto Trainium, com uma parcela crescente sendo transferida para o Trainium ao longo do tempo. Altman afirmou que a empresa está “ansiosa para levar modelos para o Trainium.”

O executivo da AWS, Garman, reconheceu que o nome do Trainium pode ter sido enganoso, já que o chip foi projetado para treinamento e inferência, sendo que a inferência deve ser o principal caso de uso no futuro. No entanto, Garman enfatizou que a marca do chip é em grande parte irrelevante para a maioria dos clientes, observando que os usuários interagem com a OpenAI por meio de sua interface de API em vez de diretamente com o hardware subjacente. Quando perguntado sobre a integração futura de modelos que não sejam da OpenAI ao Bedrock Managed Agents, Garman recusou-se a fornecer detalhes, afirmando apenas que a AWS está atualmente focada em sua parceria com a OpenAI.

A colaboração destaca a estratégia da AWS de aproveitar seus silícios personalizados para dar suporte a grandes cargas de trabalho de IA em sua plataforma de nuvem.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Plataforma de IA Certifyde arrecada $2M na rodada seed com o CEO da Ripple Brad Garlinghouse

De acordo com o ChainCatcher, a plataforma de aplicativos de IA Certifyde anunciou a conclusão de uma rodada de financiamento seed de $2 milhões. Os investidores incluem K5 Global, Flamingo Capital e investidores-anjo como o CEO da Ripple, Brad Garlinghouse, o cofundador da Honey, George Ruan, e o cofundador da Nutra, Roland

GateNews12m atrás

DeepSeek Lança Recurso de Reconhecimento de Imagens em Testes Beta

De acordo com a PANews, a DeepSeek lançou hoje o seu recurso de reconhecimento de imagens (29 de abril), atualmente em testes beta. Usuários da versão web e do aplicativo móvel podem ser selecionados para o lançamento em beta.

GateNews1h atrás

Anthropic Lança 8 Conectores de Ferramentas Criativas para o Claude, Incluindo Blender, Adobe, Autodesk

A Anthropic anunciou uma suíte de conectores de ferramentas criativas que permitem que o Claude controle diretamente softwares profissionais usados por designers e músicos. Os oito conectores iniciais abrangem modelagem 3D, design visual, produção musical e apresentações ao vivo, com parceiros incluindo Blender, Adobe,

GateNews1h atrás

Casa Branca Contorna Avaliação de Risco do Pentágono para Implantar o Modelo Mythos da Anthropic em 29 de abril

De acordo com o Whale Factor, a Casa Branca está contornando a avaliação de risco do Pentágono para implantar o modelo Mythos, da Anthropic, em agências federais em 29 de abril. A medida visa acelerar as capacidades de IA do governo federal e acompanhar o ritmo das redes de IA descentralizadas. Isso representa uma mudança significativa

GateNews1h atrás

Cognizant vai adquirir a Astreya por $600M para expandir o negócio de infraestrutura de IA

De acordo com a Reuters, em 29 de abril, a Cognizant concordou em adquirir a Astreya por aproximadamente $600 milhões, à medida que expande seus negócios de infraestrutura de IA. A Astreya é uma provedora de serviços de TI especializada em infraestrutura de IA e serviços de data center. A operação deve ser concluída no segundo trimestre

GateNews1h atrás

30 Plugins Maliciosos no ClawHub Disfarçados de Ferramentas de IA, Baixados Mais de 9.800 Vezes

De acordo com o pesquisador da Manifold, Ax Sharma, 30 plugins no ClawHub disfarçados de ferramentas legítimas de IA foram baixados mais de 9.800 vezes enquanto, secretamente, convertiam as assistentes de IA dos usuários em trabalhadoras de criptomoedas. Os plugins, publicados sob a conta imaflytok, parecem como agendadores de tarefas e ferramentas de monitoramento rotineiros, mas contêm instruções ocultas que executam operações não autorizadas a

GateNews1h atrás
Comentário
0/400
isahshavip
· 20m atrás
Corrida de touros 🐂
Ver originalResponder0