DeepSeek V4 entrega 1 trilhão de parâmetros a 1/20 do custo do GPT-5

Modelo chinês usa arquitetura MoE com 32B parâmetros ativos, janela de 1M+ tokens e roda em chips Huawei em vez de Nvidia.

07/03 às 09:00

Pontos principais

1 trilhão de parâmetros em arquitetura Mixture-of-Experts, ~32B ativos por token
Janela de contexto de 1 milhão+ de tokens com capacidade multimodal nativa
Preço de ~US$ 0,14-0,27 por milhão de tokens de entrada, 1/20 do GPT-5
Otimizado para chips Huawei Ascend e Cambricon em vez de Nvidia
DeepSeek e Qwen saltaram de 1% para 15% do mercado global de IA em 12 meses
Lançamento coincidiu com as Duas Sessões parlamentares chinesas

O DeepSeek V4 chegou com 1 trilhão de parâmetros em arquitetura Mixture-of-Experts, ativando aproximadamente 32 bilhões por token. O modelo oferece janela de contexto de mais de 1 milhão de tokens e capacidade multimodal nativa para texto, imagem e geração de vídeo.

O preço é a manchete: cerca de US$ 0,14-0,27 por milhão de tokens de entrada, aproximadamente 1/20 do custo do GPT-5. Otimizado para chips domésticos chineses Huawei Ascend e Cambricon, o modelo é uma declaração de independência em hardware. DeepSeek e Qwen juntos saltaram de 1% para 15% do mercado global de IA em apenas 12 meses.

Fontes

Lançamento do DeepSeek V4 acirra tensão tecnológica global

Aicerts • 7 mar, 09:00

DeepSeek V4 e Qwen: disrupção open-source na IA

Particula Tech • 7 mar, 09:00

DeepSeek V4: 1 trilhão de parâmetros, 1M de contexto e benchmarks de código

Abhs In • 7 mar, 09:00

Comentários

Carregando comentários...

DeepSeek V4 entrega 1 trilhão de parâmetros a 1/20 do custo do GPT-5

Pontos principais

Fontes

Lançamento do DeepSeek V4 acirra tensão tecnológica global

DeepSeek V4 e Qwen: disrupção open-source na IA

DeepSeek V4: 1 trilhão de parâmetros, 1M de contexto e benchmarks de código

Leia também

DeepSeek lança modelo de IA V4 otimizado para chips Huawei

DeepSeek lança V4-Pro e V4-Flash, maiores modelos de código aberto até hoje

DeepSeek adia V4 para garantir compatibilidade com chips Huawei, excluindo NVIDIA e AMD

DeepSeek V4 deve ser lançado até 4 de março com 1 trilhão de parâmetros e otimização para chips chineses

DeepSeek V4 lança na próxima semana: modelo de 1 trilhão de parâmetros otimizado para chips chineses

Comentários

DeepSeek V4 entrega 1 trilhão de parâmetros a 1/20 do custo do GPT-5

Pontos principais

Fontes

Lançamento do DeepSeek V4 acirra tensão tecnológica global

DeepSeek V4 e Qwen: disrupção open-source na IA

DeepSeek V4: 1 trilhão de parâmetros, 1M de contexto e benchmarks de código

Leia também

DeepSeek lança modelo de IA V4 otimizado para chips Huawei

DeepSeek lança V4-Pro e V4-Flash, maiores modelos de código aberto até hoje

DeepSeek adia V4 para garantir compatibilidade com chips Huawei, excluindo NVIDIA e AMD

DeepSeek V4 deve ser lançado até 4 de março com 1 trilhão de parâmetros e otimização para chips chineses

DeepSeek V4 lança na próxima semana: modelo de 1 trilhão de parâmetros otimizado para chips chineses

Comentários