A CoreWeave utilizou 8.192 GPUs NVIDIA Blackwell Ultra para completar o treinamento do modelo DeepSeek-V3 de 671 bilhões de parâmetros.
A CoreWeave estabeleceu um novo marco no setor de inteligência artificial ao concluir o treinamento do modelo DeepSeek-V3, com 671 bilhões de parâmetros, em pouco mais de dois minutos. O feito ocorreu durante a rodada v6.0 do MLPerf Training, benchmark reconhecido pela indústria para medir a eficiência de sistemas de computação de alto desempenho. A operação foi realizada em um cluster de 8.192 GPUs NVIDIA Blackwell Ultra (GB300 NVL72), demonstrando a capacidade de escala da infraestrutura da empresa.
Segundo a companhia, os resultados não foram obtidos em um ambiente isolado para testes, mas na mesma plataforma de nuvem utilizada por seus clientes em produção. A performance foi impulsionada por inovações de software, como o uso do framework NVIDIA NeMo e otimizações em bibliotecas de comunicação, que permitiram um aumento de 30% na velocidade de processamento do modelo em apenas três meses, sem a necessidade de alterações no hardware subjacente.
28 mai, 14:46
11 abr, 09:00
17 mar, 09:00
7 mar, 09:00
27 jan, 21:54
Carregando comentários...