TurboQuant do Google reduz uso de memória em IA sem perder precisão
Help Net Security: detalha as técnicas PolarQuant e QJL que compõem o framework TurboQuant.
|
26/03 às 09:00
Pontos principais
- Combina PolarQuant (coordenadas polares) com QJL (bits de sinal)
- Testado em Gemma e Mistral em H100
- Não requer calibração por dataset
Mencionado nesta matéria
Organizações
Google ResearchNVIDIA
