V4-Pro tem 1,6 trilhão de parâmetros e janela de 1 milhão de tokens; V4-Flash custa US$0,14/M tokens de input, o mais barato da fronteira.
A chinesa DeepSeek lançou o V4-Pro e o V4-Flash, os maiores modelos de código aberto até hoje. O V4-Pro tem 1,6 trilhão de parâmetros no total — maior que o Kimi K2.6 (1,1T) e o GLM-5.1 (754B) — com 49 bilhões ativados por vez e janela de contexto de 1 milhão de tokens. O V4-Flash, com 284 bilhões de parâmetros (13 bilhões ativos), custa US$0,14 por milhão de tokens de input, o mais barato entre os modelos na fronteira.
A Huawei confirmou que seu supercomputador SuperPod, baseado nos chips Ascend 950, já roda o V4 com latência de 20ms para o V4-Pro. O V4 introduz mecanismo de atenção híbrido que reduz o cache KV a 10% e os FLOPs por token a 27% do V3.2 em contexto de 1 milhão de tokens. A DeepSeek admite estar de três a seis meses atrás dos melhores modelos fechados, mas lidera em código e matemática entre os abertos.
24 abr, 09:04
3 abr, 09:00
7 mar, 09:00
2 mar, 15:30
1 mar, 13:19