Daily Journal

O Futuro da Informação

Nvidia anuncia chip de inferência Groq 3 LPU e rack com 256 LPUs

DatacenterDynamics: Nvidia revela Groq 3 LPU nascido da aquisição de US$ 20 bi da Groq, com rack de 256 LPUs para inferência de latência extrema.

Daily Journal
|
17/03 às 09:00

Pontos principais

  • Groq 3 LPU nasce da aquisição de US$ 20 bilhões da Groq Inc.
  • Ian Buck explica complementaridade: GPUs para throughput, LPUs para latência extrema
  • Rack LPX de 256 LPUs gera milhares de tokens por segundo por usuário

Mencionado nesta matéria

Pessoas

Jensen HuangIan Buck

Organizações

NvidiaGroq

Lugares

San Jose