A empresa disponibilizou as ferramentas DeepEP e DeepGEMM para melhorar o desempenho de modelos de linguagem e reduzir custos de processamento.
A startup DeepSeek anunciou a disponibilização de duas de suas principais infraestruturas de machine learning como código aberto. As bibliotecas DeepEP e DeepGEMM, agora sob licença MIT, visam solucionar gargalos críticos na execução de modelos de linguagem de grande escala. Enquanto o DeepEP foca na eficiência da comunicação entre especialistas em arquiteturas Mixture of Experts (MoE), o DeepGEMM oferece kernels matemáticos otimizados que suportam formatos de baixa precisão, como FP8 e FP4. A iniciativa é estratégica para desenvolvedores que buscam reduzir custos operacionais e aumentar o throughput em ambientes de produção. Ao otimizar o uso de hardware, especificamente GPUs da arquitetura Hopper, a DeepSeek busca democratizar o acesso a técnicas avançadas de inferência, facilitando a integração dessas soluções em projetos baseados em PyTorch através de compilação JIT leve.
30 jun, 10:33
29 jun, 18:04
10 jun, 13:32
28 mai, 14:46
7 mar, 09:00
Carregando comentários...