Nvidia anuncia chip de inferência Groq 3 LPU e rack com 256 LPUs
DatacenterDynamics: Nvidia revela Groq 3 LPU nascido da aquisição de US$ 20 bi da Groq, com rack de 256 LPUs para inferência de latência extrema.
|
17/03 às 09:00
Pontos principais
- Groq 3 LPU nasce da aquisição de US$ 20 bilhões da Groq Inc.
- Ian Buck explica complementaridade: GPUs para throughput, LPUs para latência extrema
- Rack LPX de 256 LPUs gera milhares de tokens por segundo por usuário
Mencionado nesta matéria
Pessoas
Jensen HuangIan Buck
Organizações
NvidiaGroq
Lugares
San Jose
