TurboQuant do Google tende a aumentar demanda por chips de memória, não reduzi-la

Algoritmo que reduz 6x o uso de memória em IA libera gargalos e permite treinar modelos maiores; preços de DRAM subiram 55-60% no 1º trimestre.

12/04 às 09:00

Pontos principais

TurboQuant reduz em 6x o uso de memória e acelera inferência em 8x
Analistas concluem que eficiência vai aumentar demanda por chips, não reduzi-la

Analistas concluíram que o TurboQuant do Google, algoritmo detalhado em março que reduz em 6 vezes o uso de memória em modelos de IA e acelera inferência em 8 vezes, tende a aumentar a demanda por chips de memória em vez de reduzi-la. A lógica é o paradoxo de Jevons: remover gargalos libera o treinamento de modelos maiores e mais capazes.

Os parâmetros dos maiores LLMs cresceram de 0,09 bilhão em 2019 para mais de 1 trilhão hoje. Os preços de chips de memória DRAM já subiram 55-60% no primeiro trimestre, com HBM consumindo 23% da produção total de wafers de DRAM, ante 19% no ano anterior.

O Futuro da Informação

TurboQuant do Google tende a aumentar demanda por chips de memória, não reduzi-la

Pontos principais

Fontes

TurboQuant do Google gera três ações com potencial milionário escondidas à vista

Leia também

TurboQuant do Google comprime memória de IA em 6x e apaga ~$100bi em ações de chips

Google lança TurboQuant: 6x menos memória e 8x mais velocidade em LLMs

Nvidia revela GPU Vera Rubin na GTC e projeta $1 trilhão em pedidos de chips

Nvidia cai após balanço recorde: receita de $68,1 bi e guidance de $78 bi não impedem perda de $260 bi

Nvidia registra receita recorde de $68,1 bilhões no Q4 e ação cai 5,5% após resultados