FOMO é por que empresas pagam por GPUs que não usam — e por que os preços continuam subindo
Empresas estão pagando por GPUs subutilizadas devido ao FOMO e à escassez, elevando os preços e criando um ciclo vicioso no mercado de computação em nuvem para IA.
|
29/04 às 12:12
Pontos principais
- Empresas utilizam apenas cerca de 5% de sua capacidade de GPU, segundo relatório da Cast AI, devido ao medo de perder alocação em um mercado escasso.
- A subutilização é exacerbada por contratos de longo prazo e arquiteturas de workload ineficientes, onde GPUs ficam ociosas durante fases de processamento de CPU.
- Os preços de GPUs e serviços de nuvem para IA estão subindo, quebrando um padrão de 20 anos de redução de custos, com aumentos notáveis da AWS e fornecedores de memória.
- O mercado de computação em nuvem se dividiu em duas camadas: uma de commodities com preços em queda e outra de fronteira (GPUs de ponta) com preços em ascensão devido à alta demanda e escassez.
- Melhorar a utilização das GPUs existentes, através de compartilhamento de tempo, bin-packing e seleção adequada de chips para cada workload, pode gerar economias significativas.
- A auditoria de workloads para garantir que o chip utilizado é o mais adequado para a tarefa é uma medida gratuita e eficaz para combater o desperdício.
- A estratégia ideal para 2026 envolve misturar diferentes caminhos de aquisição de GPUs (on-demand, blocos de capacidade, nuvens especializadas, on-premise) e não depender de um único plano de longo prazo.
Mencionado nesta matéria
Pessoas
Laurent Gil (co-fundador e presidente da Cast AI)Tracy Woo (analista principal da Forrester)
Organizações
Cast AIAWSLambda LabsRunPodNvidiaTSMCAMDForresterAnyscaleGartnerCanvaCoreWeaveGMIVast.aiio.netAethirOpenCostKubecostScaleOpsnOpsPerfectScaleVantage

