Modelo de mistura de especialistas usa apenas 3B de 35B parâmetros, cortando 90% do custo computacional e rodando em hardware doméstico.
A Alibaba publicou o Qwen3.6-35B-A3B, modelo sob licença aberta que usa mistura de especialistas para ativar só uma fração dos parâmetros por vez. Com 35 bilhões de parâmetros totais mas apenas 3 bilhões ativos, o modelo corta cerca de 90% do custo computacional.
O Qwen3.6 é nativamente multimodal, suportando texto, imagem e vídeo. Processa vídeos de até uma hora e alcançou 83,7% no VideoMMU. Uma versão quantizada de 21 GB roda em placas de vídeo domésticas.
17 abr, 09:00
2 abr, 09:00
1 abr, 09:00
31 mar, 09:00
26 fev, 18:39