TurboQuant do Google comprime memória de IA em...

O Google Research publicou o TurboQuant, algoritmo de compressão em dois estágios que reduz o KV cache de inferência de LLMs em pelo menos 6x sem perda de acurácia, alcançando precisão de 3 bits e até 8x mais velocidade em operações de atenção em GPUs H100 da NVIDIA — sem necessidade de retreinar modelos.

O impacto no mercado foi imediato: ações de chips de memória perderam ~$100 bilhões em valor na semana, lideradas por Micron (-15%), SK Hynix (-6%) e Samsung (-5%). O temor de redução na demanda por memória HBM para IA provocou vendas em cadeia. Analistas contrapõem invocando o Paradoxo de Jevons — ganhos de eficiência podem aumentar a demanda total via adoção mais ampla. O paper será apresentado na ICLR 2026.

TurboQuant do Google comprime memória de IA em 6x e apaga ~$100bi em ações de chips

Pontos principais

Fontes

TurboQuant do Google provoca sell-off de semicondutores, chocando investidores de Hynix e Samsung

Ações de chips de memória nos EUA perdem $100bi após algoritmo TurboQuant do Google

TurboQuant do Google corta uso de memória de IA em 6x e provoca turbulência no mercado

Leia também

Micron começa a entregar SSD de 245 TB e valor de mercado passa de US$700 bilhões

SK Hynix bate recorde com receita de US$38,9 bi e margem de 72% no 1º trimestre

Nvidia cai após balanço recorde: receita de $68,1 bi e guidance de $78 bi não impedem perda de $260 bi

IDC projeta colapso de 12,9% no mercado global de smartphones por crise de memória

Nvidia registra receita recorde de $68,1 bilhões no Q4 e ação cai 5,5% após resultados

Comentários