Modelo de quase 12 bi de parâmetros sob Apache 2.0 com janela de 256K tokens, sem encoders separados de imagem ou áudio.
O Google publicou em 3 de junho o Gemma 4 12B, modelo aberto multimodal sob licença Apache 2.0 que projeta diretamente imagens em patches e ondas de áudio brutas no espaço de embedding do LLM, sem encoders separados. Com janela de contexto de 256 mil tokens, cabe em 16 GB de memória — o suficiente para rodar em laptops comuns sem nuvem.
A família Gemma 4 atinge 89,2% no AIME 2026 e 86,4% no tau2-bench retail no modelo de 31B. Junto do lançamento, o Google publicou versões macOS do AI Edge Gallery e um app de ditado por voz no aparelho.
3 jun, 16:05
20 mai, 09:00
3 abr, 09:00
2 abr, 14:04
27 mar, 09:00
Carregando comentários...