O Futuro da Informação

Nvidia anuncia chip de inferência Groq 3 LPU e rack com 256 LPUs

DatacenterDynamics: Nvidia revela Groq 3 LPU nascido da aquisição de US$ 20 bi da Groq, com rack de 256 LPUs para inferência de latência extrema.

|

17/03 às 09:00

Pontos principais

Groq 3 LPU nasce da aquisição de US$ 20 bilhões da Groq Inc.
Ian Buck explica complementaridade: GPUs para throughput, LPUs para latência extrema
Rack LPX de 256 LPUs gera milhares de tokens por segundo por usuário

Mencionado nesta matéria

Pessoas

Jensen HuangIan Buck

Organizações

NvidiaGroq

Lugares

San Jose

Faz parte de

Nvidia revela Groq 3 LPU e Vera CPU para inferência agêntica

17 mar, 09:00 • Daily Journal • 3 fontes

Fonte

Ver matéria original

Datacenterdynamics • 17 mar, 09:00