Mensagem do Gate News, 29 de abril — Modelos da OpenAI executados no Amazon Web Services’ Bedrock irão migrar gradualmente para o Trainium, o chip de IA personalizado da Amazon, de acordo com comentários recentes do CEO da OpenAI, Sam Altman, e de executivos da AWS. Atualmente, os modelos operam em um ambiente misto usando tanto GPUs quanto Trainium, com uma parcela crescente sendo transferida para o Trainium ao longo do tempo. Altman afirmou que a empresa está “ansiosa para levar modelos para o Trainium.”
O executivo da AWS, Garman, reconheceu que o nome do Trainium pode ter sido enganoso, já que o chip foi projetado para treinamento e inferência, sendo que a inferência deve ser o principal caso de uso no futuro. No entanto, Garman enfatizou que a marca do chip é em grande parte irrelevante para a maioria dos clientes, observando que os usuários interagem com a OpenAI por meio de sua interface de API em vez de diretamente com o hardware subjacente. Quando perguntado sobre a integração futura de modelos que não sejam da OpenAI ao Bedrock Managed Agents, Garman recusou-se a fornecer detalhes, afirmando apenas que a AWS está atualmente focada em sua parceria com a OpenAI.
A colaboração destaca a estratégia da AWS de aproveitar seus silícios personalizados para dar suporte a grandes cargas de trabalho de IA em sua plataforma de nuvem.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Plataforma de IA Certifyde arrecada $2M na rodada seed com o CEO da Ripple Brad Garlinghouse
De acordo com o ChainCatcher, a plataforma de aplicativos de IA Certifyde anunciou a conclusão de uma rodada de financiamento seed de $2 milhões. Os investidores incluem K5 Global, Flamingo Capital e investidores-anjo como o CEO da Ripple, Brad Garlinghouse, o cofundador da Honey, George Ruan, e o cofundador da Nutra, Roland
GateNews12m atrás
DeepSeek Lança Recurso de Reconhecimento de Imagens em Testes Beta
De acordo com a PANews, a DeepSeek lançou hoje o seu recurso de reconhecimento de imagens (29 de abril), atualmente em testes beta. Usuários da versão web e do aplicativo móvel podem ser selecionados para o lançamento em beta.
GateNews1h atrás
Anthropic Lança 8 Conectores de Ferramentas Criativas para o Claude, Incluindo Blender, Adobe, Autodesk
A Anthropic anunciou uma suíte de conectores de ferramentas criativas que permitem que o Claude controle diretamente softwares profissionais usados por designers e músicos. Os oito conectores iniciais abrangem modelagem 3D, design visual, produção musical e apresentações ao vivo, com parceiros incluindo Blender, Adobe,
GateNews1h atrás
Casa Branca Contorna Avaliação de Risco do Pentágono para Implantar o Modelo Mythos da Anthropic em 29 de abril
De acordo com o Whale Factor, a Casa Branca está contornando a avaliação de risco do Pentágono para implantar o modelo Mythos, da Anthropic, em agências federais em 29 de abril. A medida visa acelerar as capacidades de IA do governo federal e acompanhar o ritmo das redes de IA descentralizadas. Isso representa uma mudança significativa
GateNews1h atrás
Cognizant vai adquirir a Astreya por $600M para expandir o negócio de infraestrutura de IA
De acordo com a Reuters, em 29 de abril, a Cognizant concordou em adquirir a Astreya por aproximadamente $600 milhões, à medida que expande seus negócios de infraestrutura de IA. A Astreya é uma provedora de serviços de TI especializada em infraestrutura de IA e serviços de data center. A operação deve ser concluída no segundo trimestre
GateNews1h atrás
30 Plugins Maliciosos no ClawHub Disfarçados de Ferramentas de IA, Baixados Mais de 9.800 Vezes
De acordo com o pesquisador da Manifold, Ax Sharma, 30 plugins no ClawHub disfarçados de ferramentas legítimas de IA foram baixados mais de 9.800 vezes enquanto, secretamente, convertiam as assistentes de IA dos usuários em trabalhadoras de criptomoedas. Os plugins, publicados sob a conta imaflytok, parecem como agendadores de tarefas e ferramentas de monitoramento rotineiros, mas contêm instruções ocultas que executam operações não autorizadas a
GateNews1h atrás