A Moonshot AI promete 30% mais eficiência em tokens de raciocínio, mas especialistas questionam a precisão dos benchmarks internos da empresa.
A Moonshot AI anunciou o lançamento do Kimi K2.7-Code, um modelo focado em programação que promete uma redução de 30% no consumo de tokens de raciocínio. Embora a empresa reporte ganhos de desempenho de dois dígitos em seus testes proprietários, a ausência de validação por benchmarks independentes, como o DeepSWE, gerou ceticismo na comunidade técnica. Pesquisadores sugerem que, embora o modelo demonstre maior precisão na escrita de código, sua capacidade em resolver problemas complexos ainda não foi comprovada fora do ambiente controlado da startup. A facilidade de integração via API compatível com a OpenAI permite que empresas testem a nova versão, mas especialistas recomendam cautela, sugerindo que as equipes realizem validações internas com suas próprias cargas de trabalho antes de adotar a tecnologia em ambientes de produção.
8 jun, 00:31
1 jun, 22:02
20 mai, 17:04
11 mai, 20:34
7 mai, 02:02
Carregando comentários...