Mensagem do Gate News, 25 de abril — A escassez de GPUs está voltando a aparecer, já que grandes provedores de nuvem, incluindo Microsoft e Amazon, concentram capacidade de computação em equipes internas e grandes clientes como OpenAI e Anthropic, deixando startups menores de IA enfrentando aumentos de preços, tempos de espera mais longos e termos contratuais mais rígidos. A gestão comercial do Microsoft Azure informou a equipe que os tempos de espera por GPUs para clientes de nuvem devem persistir até o fim de 2026.
A startup de geração de imagens Krea, que levantou $83 milhões de investidores incluindo Andreessen Horowitz e Bain Capital Ventures, anteriormente alugava centenas de chips Blackwell a US$ 2,80 por hora sob um contrato de seis meses. Na renovação, vários provedores de nuvem pararam de responder a consultas; a Krea, por fim, conseguiu chips a US$ 3,70 por hora, um aumento de 32%, com o contrato estendido para um ano. O CEO Victor Perez observou que alguns fornecedores simplesmente não responderam, enquanto outros insistiram em compromissos de vários anos antes de negociar. O CEO do provedor de nuvem de GPU Lightning AI, Will Falcon, revelou que a empresa opera 40.000 GPUs online, mas cerca de 40 clientes na fila exigem, em conjunto, 400.000 GPUs, com os preços de locação subindo mais de 25% em seis meses.
A Microsoft implementou um gerenciamento de acesso a GPUs em camadas: aproximadamente 1.000 dos maiores clientes (Tier 1) recebem prioridade na alocação, enquanto clientes menores que buscam chips Blackwell precisam se comprometer com pelo menos 1.000 unidades por um mínimo de um ano, com contratos começando em dezenas de milhões de dólares. Clientes pay-as-you-go correm o risco de perder acesso a GPUs se os dispositivos ficarem ociosos por várias horas. Startups que participam do programa de camada gratuita do Microsoft for Startups também foram alertadas de que a utilização insuficiente de GPUs pode resultar na revogação do acesso.
A firma de capital de risco General Catalyst está pesquisando suas empresas da carteira sobre gargalos de computação e explorando pools compartilhados de GPUs ou estratégias de negociação coletiva. Algumas startups estão considerando compras diretas de GPUs para contornar as filas: a startup de IA do setor de petróleo Collide planeja gastar aproximadamente US$ 500.000 em GPUs Nvidia, alugando espaço em data center para operar de forma independente e evitar a incerteza.
Related Articles
Morgan Stanley Lança Fundo de Reservas de Stablecoin, Se Posicionando como Gestor de Reservas da Indústria
As ofertas públicas iniciais da SpaceX, OpenAI e Anthropic podem atrair mais de $240 bilhões, potencialmente impactando a liquidez do mercado cripto
ETFs Spot de Ethereum Registram Entradas Líquidas de US$ 23,38M; BlackRock ETHB Lidera com US$ 32,25M
ETFs Spot de Bitcoin Registram US$ 144,49M de Entradas Líquidas, Estendendo Sequência de 9 Dias
JPMorgan: A tokenização vai impulsionar mudanças na indústria de fundos, mas 'bons casos de uso' ainda estão anos de distância
Bitdeer vende toda a produção semanal de 185,7 BTC e mantém participação zero em Bitcoin