Alibaba lança Qwen3.6-35B-A3B, modelo aberto que rivaliza com modelos 10x maiores

Modelo de mistura de especialistas usa apenas 3B de 35B parâmetros, cortando 90% do custo computacional e rodando em hardware doméstico.

17/04 às 09:00

Pontos principais

35 bilhões de parâmetros totais, apenas 3 bilhões ativos por token
Técnica de mistura de especialistas (256 especialistas, 8+1 ativados por camada)
73,4% no SWE-bench Verified, superando Gemma4-31B por 21,4 pontos
Versão comprimida de 21 GB roda em RTX 4090 ou MacBook M5
Licença Apache 2.0 sem restrições de uso

A Alibaba publicou o Qwen3.6-35B-A3B, modelo sob licença aberta que usa mistura de especialistas para ativar só uma fração dos parâmetros por vez. Com 35 bilhões de parâmetros totais mas apenas 3 bilhões ativos, o modelo corta cerca de 90% do custo computacional.

O Qwen3.6 é nativamente multimodal, suportando texto, imagem e vídeo. Processa vídeos de até uma hora e alcançou 83,7% no VideoMMU. Uma versão quantizada de 21 GB roda em placas de vídeo domésticas.

Comentários

Carregando comentários...

Alibaba lança Qwen3.6-35B-A3B, modelo aberto que rivaliza com modelos 10x maiores

Pontos principais

Leia também

Alibaba lança Qwen3.6-35B-A3B, modelo aberto que corta 90% do custo computacional

Alibaba lança Qwen3.6-Plus com 1M de contexto e foco em IA agêntica

Startups lançam modelos de IA ultra-compactos para rodar em dispositivos

Alibaba lança Qwen3.5-Omni com 215 recordes em benchmarks e supera Gemini 3.1 Pro

Alibaba lança Qwen 3.5 Medium com desempenho de Sonnet 4.5 em GPUs de consumidor