Modelo proprietário construiu seus próprios harnesses de RL e executou mais de 100 rodadas de auto-aperfeiçoamento, com melhoria de 30%.
A MiniMax lançou o M2.7, seu primeiro modelo proprietário que participou ativamente da própria evolução. Durante o desenvolvimento, o modelo construiu autonomamente seus harnesses de reinforcement learning, atualizou sua memória e criou dezenas de habilidades complexas, executando mais de 100 rodadas de auto-aperfeiçoamento iterativo.
O resultado foi uma melhoria de 30% em avaliações internas e desempenho competitivo em benchmarks: 56,22% no SWE-Pro (próximo ao Claude Opus 4.6), 55,6% no VIBE-Pro e ELO 1495 no GDPval-AA — superando o GPT-5.3 em coding e raciocínio. A mudança para proprietário representa uma virada estratégica para a empresa, anteriormente referência do open-source chinês.
11 mar, 09:00
10 mar, 09:00
2 mar, 15:30
1 mar, 13:19
26 fev, 18:39