Modelo chinês usa arquitetura MoE com 32B parâmetros ativos, janela de 1M+ tokens e roda em chips Huawei em vez de Nvidia.
O DeepSeek V4 chegou com 1 trilhão de parâmetros em arquitetura Mixture-of-Experts, ativando aproximadamente 32 bilhões por token. O modelo oferece janela de contexto de mais de 1 milhão de tokens e capacidade multimodal nativa para texto, imagem e geração de vídeo.
O preço é a manchete: cerca de US$ 0,14-0,27 por milhão de tokens de entrada, aproximadamente 1/20 do custo do GPT-5. Otimizado para chips domésticos chineses Huawei Ascend e Cambricon, o modelo é uma declaração de independência em hardware. DeepSeek e Qwen juntos saltaram de 1% para 15% do mercado global de IA em apenas 12 meses.
8 mar, 09:00
6 mar, 09:00
2 mar, 15:30
1 mar, 13:19
26 fev, 14:57