MiniMax lança M2.1 e afirma superar Claude Sonnet 4.5 em programação multilíngue

Atualização do laboratório chinês mira agentes de código em múltiplos frameworks; empresa apresenta novo benchmark próprio, o VIBE.

22/06 às 09:00

Pontos principais

MiniMax-M2.1 é a atualização do M2 focada em programação em múltiplas linguagens
Empresa diz que o modelo 'supera o Claude Sonnet 4.5 e se aproxima do Claude Opus 4.5'
Testado no SWE-bench Verified em diferentes frameworks de agente, com 'estabilidade robusta'
MiniMax apresentou o benchmark VIBE (Visual & Interactive Benchmark for Execution)
VIBE tem cinco subsets: Web, Simulação, Android, iOS e Backend
M2.1 marcou média 88,6, com 91,5 em VIBE-Web e 89,7 em VIBE-Android

A MiniMax, laboratório chinês, lançou hoje o MiniMax-M2.1, atualização do M2 focada em programação em diferentes linguagens. Em comunicado, a empresa afirma que o modelo 'supera o Claude Sonnet 4.5 e se aproxima do Claude Opus 4.5'.

O MiniMax-M2.1 foi avaliado no SWE-bench Verified em diferentes frameworks de agentes de código, com o que a empresa descreve como 'generalização excepcional entre frameworks e estabilidade robusta'. A MiniMax também introduziu um benchmark próprio, o VIBE (Visual & Interactive Benchmark for Execution), com cinco subsets — Web, Simulação, Android, iOS, Backend — e usa o paradigma 'Agent-as-a-Verifier' para avaliar lógica interativa e estética visual em ambiente real. O modelo marcou média 88,6, com destaque para VIBE-Web (91,5) e VIBE-Android (89,7).

Comentários

Carregando comentários...

Home / Tecnologia

MiniMax lança M2.1 e afirma superar Claude Sonnet 4.5 em programação multilíngue

Atualização do laboratório chinês mira agentes de código em múltiplos frameworks; empresa apresenta novo benchmark próprio, o VIBE.

22/06 às 09:00

Pontos principais

MiniMax-M2.1 é a atualização do M2 focada em programação em múltiplas linguagens
Empresa diz que o modelo 'supera o Claude Sonnet 4.5 e se aproxima do Claude Opus 4.5'
Testado no SWE-bench Verified em diferentes frameworks de agente, com 'estabilidade robusta'
MiniMax apresentou o benchmark VIBE (Visual & Interactive Benchmark for Execution)
VIBE tem cinco subsets: Web, Simulação, Android, iOS e Backend
M2.1 marcou média 88,6, com 91,5 em VIBE-Web e 89,7 em VIBE-Android

Comentários

Carregando comentários...

MiniMax lança M2.1 e afirma superar Claude Sonnet 4.5 em programação multilíngue

Pontos principais

Leia também

MiniMax lança M3, modelo de agentes de programação com 1 milhão de tokens de contexto

MiniMax anuncia modelo M3 com arquitetura de atenção esparsa

MiniMax libera M2.1 em código aberto e iguala Claude Sonnet 4.5 em codificação

MiniMax libera modelo M2.7 com código aberto: primeiro a participar do próprio desenvolvimento

MiniMax lança M2.7, modelo autoevolutivo com 100+ ciclos de RL

Comentários

MiniMax lança M2.1 e afirma superar Claude Sonnet 4.5 em programação multilíngue

Pontos principais

Leia também

MiniMax lança M3, modelo de agentes de programação com 1 milhão de tokens de contexto

MiniMax anuncia modelo M3 com arquitetura de atenção esparsa

MiniMax libera M2.1 em código aberto e iguala Claude Sonnet 4.5 em codificação

MiniMax libera modelo M2.7 com código aberto: primeiro a participar do próprio desenvolvimento

MiniMax lança M2.7, modelo autoevolutivo com 100+ ciclos de RL

Comentários