DeepSeek V4: lançamento do V4-Pro e V4-Flash em preview
DeepSeek: anúncio oficial do V4-Pro (1,6T parâmetros) e V4-Flash (284B), ambos com contexto de 1M de tokens e licença MIT.
|
24/04 às 09:00
Pontos principais
- V4-Pro: 1,6T parâmetros totais, 49B ativos, pré-treinado em 33T tokens
- V4-Flash: 284B totais, 13B ativos, treinado em 32T tokens
- Ambos com janela de contexto de 1 milhão de tokens
Mencionado nesta matéria
Organizações
DeepSeekHuaweiAlibabaByteDanceTencentCambricon
Lugares
China
