Alibaba lança Qwen3.5-Omni com 215 recordes em...

A Alibaba lançou o Qwen3.5-Omni, um modelo de linguagem totalmente omnimodal que entende e gera texto, imagem, áudio e vídeo. O modelo aceita mais de 10 horas de áudio como input e vem com busca na web em tempo real integrada.

A variante Plus superou o Gemini 3.1 Pro do Google em testes de áudio e alcançou 215 resultados estado-da-arte em benchmarks diversos. Entre os recursos de destaque está o 'audio-visual vibe coding', onde o usuário aponta a câmera para algo, descreve o que quer e o modelo gera código a partir disso.

Alibaba lança Qwen3.5-Omni com 215 recordes em benchmarks e supera Gemini 3.1 Pro

Pontos principais

Fontes

Alibaba Qwen 3.5-Omni supera Gemini 3.1 Pro em 215 benchmarks

Análise do Qwen3.5-Omni: mais de 10h de áudio e vibe coding audiovisual

Qwen3.5-Omni: modelo omnimodal da Alibaba

Leia também

Alibaba lança Qwen3.6-35B-A3B, modelo aberto que corta 90% do custo computacional

Alibaba lança Qwen3.6-Plus com 1M de contexto e foco em IA agêntica

Google lança Gemini 3.1 Flash Live, modelo de áudio em tempo real

Alibaba lança Qwen 3.5 Medium com desempenho de Sonnet 4.5 em GPUs de consumidor

Google lança Nano Banana 2 com qualidade Pro na velocidade Flash em 141 países

Comentários