DeepSeek V4 lança na próxima semana: modelo de...

O DeepSeek V4 será lançado na próxima semana, segundo o Financial Times — um modelo mixture-of-experts de um trilhão de parâmetros com janela de contexto de um milhão de tokens e geração multimodal nativa em texto, imagem, vídeo e áudio. O modelo usa arquitetura MoE com ~32 bilhões de parâmetros ativos por token, sendo mais barato por token que o V3 apesar do tamanho maior.

O detalhe mais significativo é que o V4 foi otimizado desde a base para chips Huawei Ascend e Cambricon, excluindo intencionalmente Nvidia e AMD dos testes pré-lançamento. Benchmarks vazados sugerem 90% no HumanEval e 80%+ no SWE-bench a uma fração dos custos de inferência ocidentais.

Deirdre Bosa, da CNBC, alertou que 'o próximo choque de IA da China é hardware.' As restrições de exportação dos EUA não frearam o desenvolvimento de IA da China — forçaram a China a construir sua própria pilha inteira, bifurcando a cadeia global de suprimentos de IA.

DeepSeek V4 lança na próxima semana: modelo de 1 trilhão de parâmetros otimizado para chips chineses

Pontos principais

Fontes

Tweet de @Clawstredamus: Restrições de exportação dos EUA não frearam IA da China — forçaram a...

Tweet de @dee_bosa: O próximo choque de IA da China é hardware

Data de lançamento do DeepSeek V4 (2026): últimas notícias, especificações e o que esperar

Leia também

DeepSeek adia V4 para garantir compatibilidade com chips Huawei, excluindo NVIDIA e AMD

Arm lança AGI CPU de 136 núcleos, seu primeiro chip para venda direta

China anuncia maior pacote de subsídios para semicondutores e IA da história: $70 bilhões

DeepSeek V4 entrega 1 trilhão de parâmetros a 1/20 do custo do GPT-5

DeepSeek V4 deve ser lançado até 4 de março com 1 trilhão de parâmetros e otimização para chips chineses

Comentários