Mistral AI lança Leanstral 1.5 para verificação formal de código
O novo modelo open-source Leanstral 1.5 aprimora a verificação matemática e de software com alta eficiência e custo reduzido.
Pontos principais
- Modelo utiliza arquitetura Mixture of Experts com 119 bilhões de parâmetros totais e 6 bilhões ativos.
- Atingiu 100% de aproveitamento no benchmark miniF2F e resolveu 587 de 672 problemas do PutnamBench.
- Estabeleceu novo estado da arte em álgebra avançada com 87% no FATE-H e 34% no FATE-X.
- Custo operacional de US$ 4 por problema, significativamente inferior aos US$ 300 de modelos concorrentes.
- Identificou 11 bugs reais em 57 repositórios de código aberto, sendo 5 deles inéditos.
- Licenciado sob Apache 2.0, o modelo está disponível no Hugging Face e via API gratuita.
A Mistral AI anunciou o lançamento do Leanstral 1.5, um modelo de linguagem especializado em verificação formal na linguagem Lean 4. Projetado para atuar como um agente de engenharia de provas, o sistema utiliza uma arquitetura de Mixture of Experts (MoE) que permite alta performance em tarefas complexas de raciocínio lógico e matemático, mantendo apenas 6 bilhões de parâmetros ativos por token.
Além de seu desempenho superior em competições acadêmicas, como o PutnamBench, o Leanstral 1.5 demonstra utilidade prática na detecção de falhas em softwares reais. Ao integrar ferramentas como o Aeneas para tradução de código Rust, o modelo consegue inferir intenções de desenvolvedores e validar propriedades de segurança, superando métodos tradicionais de testes e fuzzing em casos de borda críticos.
Tópicos relacionados
Comentários
Carregando comentários...
