Alibaba lança Qwen3.6-35B-A3B, modelo aberto que corta 90% do custo computacional

Modelo de mistura de especialistas tem 35 bilhões de parâmetros totais mas apenas 3 bilhões ativos por token; versão comprimida roda em hardware doméstico.

17/04 às 09:00

Pontos principais

Arquitetura MoE: 256 especialistas, 9 ativados por camada, reduzindo custo em ~90%
73,4% no SWE-bench Verified, superando Gemma4-31B do Google por 21,4 pontos
Licença Apache 2.0 sem restrições de uso
Versão quantizada de 21 GB roda em RTX 4090 ou MacBook M5
Suporte nativo a texto, imagem e vídeo, com até 224K tokens de vídeo

A Alibaba publicou o Qwen3.6-35B-A3B, modelo de linguagem sob licença aberta baseado em mistura de especialistas (MoE). Com 35 bilhões de parâmetros totais mas apenas 3 bilhões ativos por token, o modelo reduz o custo computacional em cerca de 90% em relação a arquiteturas densas equivalentes.

No SWE-bench Verified, atinge 73,4%, superando o Gemma4-31B do Google por 21,4 pontos. O modelo é nativamente multimodal, processando texto, imagem e vídeos de até uma hora. Uma versão comprimida de 21 GB roda em placas de vídeo domésticas como a RTX 4090.

O Futuro da Informação

Alibaba lança Qwen3.6-35B-A3B, modelo aberto que corta 90% do custo computacional

Pontos principais

Fontes

Qwen3.6: IA de código aberto supera modelos 10x maiores

Leia também

Alibaba lança Qwen3.6-35B-A3B, modelo aberto que rivaliza com modelos 10x maiores

Alibaba lança Qwen3.6-Plus com 1M de contexto e foco em IA agêntica

Startups lançam modelos de IA ultra-compactos para rodar em dispositivos

Alibaba lança Qwen3.5-Omni com 215 recordes em benchmarks e supera Gemini 3.1 Pro

Alibaba lança Qwen 3.5 Medium com desempenho de Sonnet 4.5 em GPUs de consumidor