Empresas enfrentam subutilização de 95% em GPUs de IA, gerando US$ 401 bi em ineficiência

Apesar de um investimento de US$ 401 bilhões em infraestrutura de inteligência artificial, empresas registram uma taxa média de utilização de apenas 5% de suas GPUs, indicando uma ineficiência significativa.

Empresas enfrentam subutilização de 95% em GPUs de IA, gerando US$ 401 bi em ineficiência — Foto: Venturebeat

08/05 às 10:39

Pontos principais

A utilização média de GPUs em empresas é de apenas 5%, apesar de US$ 401 bilhões gastos em infraestrutura de IA.
A subutilização é impulsionada por um ciclo de aquisição que transforma recursos ociosos em custos fixos depreciativos.
A escassez de chips serviu como justificativa para compras ineficientes, mas o foco agora é em integração e custo total de propriedade (TCO).
A era do "cheque em branco" para IA terminou, com a inferência se tornando um item estratégico e modelos de precificação baseados em uso expondo ineficiências.
Empresas buscam otimização de custos e plataformas de IA em nuvens especializadas ou soluções de inferência gerenciada.

Empresas estão enfrentando um problema de subutilização massiva em sua infraestrutura de inteligência artificial, com uma média de apenas 5% de uso de suas unidades de processamento gráfico (GPUs). Este cenário resulta em um gasto ineficiente de US$ 401 bilhões, evidenciando uma falha na maximização do retorno econômico sobre os ativos existentes. A narrativa de escassez de chips, que impulsionou a aquisição desenfreada, mascarou a ineficiência, transformando recursos ociosos em custos fixos depreciativos.

O mercado de IA está em transição, com a prioridade mudando do simples acesso à GPU para a integração, segurança e o custo total de propriedade (TCO). A era dos investimentos ilimitados em IA chegou ao fim, e a inferência se tornou um componente estratégico, com novos modelos de precificação baseados em uso que expõem as ineficiências arquitetônicas. Para combater essa realidade, empresas buscam otimização de custos e soluções em nuvens especializadas ou inferência gerenciada para aumentar a produtividade de suas GPUs.

Fontes

5% GPU utilization: The $401 billion AI infrastructure problem enterprises can't keep ignoring

Venturebeat • 8 mai, 10:00

Comentários

Carregando comentários...

Empresas enfrentam subutilização de 95% em GPUs de IA, gerando US$ 401 bi em ineficiência

Pontos principais

Fontes

5% GPU utilization: The $401 billion AI infrastructure problem enterprises can't keep ignoring

Leia também

Empresas adotam controle de custos para gerenciar gastos com tokens de IA

Empresas reduzem uso de IA devido ao alto custo operacional

Empresas restringem uso de IA após estouro de orçamentos

Empresas pagam por GPUs subutilizadas devido ao FOMO, elevando preços

Custos de IA superam salários de funcionários em empresas

Comentários

Fontes

5% GPU utilization: The $401 billion AI infrastructure problem enterprises can't keep ignoring

Leia também

Empresas adotam controle de custos para gerenciar gastos com tokens de IA

Empresas reduzem uso de IA devido ao alto custo operacional

Empresas restringem uso de IA após estouro de orçamentos

Empresas pagam por GPUs subutilizadas devido ao FOMO, elevando preços

Custos de IA superam salários de funcionários em empresas