Daily Journal

O Futuro da Informação

Daily Journal

DeepSeek V4: lançamento do V4-Pro e V4-Flash em preview

DeepSeek: anúncio oficial do V4-Pro (1,6T parâmetros) e V4-Flash (284B), ambos com contexto de 1M de tokens e licença MIT.

Daily Journal
|
24/04 às 09:00

Pontos principais

  • V4-Pro: 1,6T parâmetros totais, 49B ativos, pré-treinado em 33T tokens
  • V4-Flash: 284B totais, 13B ativos, treinado em 32T tokens
  • Ambos com janela de contexto de 1 milhão de tokens

Mencionado nesta matéria

Organizações

DeepSeekHuaweiAlibabaByteDanceTencentCambricon

Lugares

China