Daily Journal
Daily Journal

Utilização de GPU de 5%: O problema de infraestrutura de IA de US$ 401 bilhões que as empresas não podem mais ignorar

Empresas enfrentam um problema de subutilização de GPU de 95% na infraestrutura de IA, resultando em US$ 401 bilhões em gastos ineficientes, forçando uma mudança de mentalidade de aquisição para maximização do retorno econômico dos ativos existentes.

Daily Journal
|
08/05 às 10:00

Pontos principais

  • Apesar de US$ 401 bilhões em gastos com infraestrutura de IA, a utilização média de GPU nas empresas é de apenas 5%.
  • A subutilização de GPUs é impulsionada por um ciclo de aquisição que torna difícil liberar recursos ociosos, transformando-os em custos fixos depreciativos.
  • A narrativa de escassez de chips serviu como uma cortina de fumaça para a ineficiáncia, com empresas comprando chips, mas gerando pouco resultado ótil.
  • O mercado está mudando, com a prioridade se deslocando do acesso à GPU para integração, segurança e custo total de propriedade (TCO).
  • A era do "cheque em branco" para IA acabou, e a inferêça se torna um item estratégico, com modelos de precificação baseados em uso expondo ineficiêâncias arquitetônicas.
  • Empresas estão buscando otimização de custos e plataformas de IA em nuvens especializadas ou soluções de inferêça gerenciada para aumentar a produtividade das GPUs.
  • A eficiêância da infraestrutura de IA depende de otimizações na rede (RDMA), memória (cache KV compartilhado) e armazenamento, além de considerações de soberania de dados para segurança e confiança.

Mencionado nesta matéria

Pessoas

Rob Strechay (Contributing VentureBeat analyst and principal at Smuget Consulting)

Organizações

GartnerAWSAzureGCPIntuitMastercardPfizerVentureBeatCoreweaveLambdaCrusoeBasetenAnyscaleFireworksAITogether AIRed HatNutanixBroadcomGoogleNvidiaVAST DataHPEWEKA.ioDellSmuget Consulting