Mistral AI lança Leanstral 1.5 para verificação formal de código

O novo modelo open-source Leanstral 1.5 aprimora a verificação matemática e de software com alta eficiência e custo reduzido.

04/07 às 17:47

Pontos principais

Modelo utiliza arquitetura Mixture of Experts com 119 bilhões de parâmetros totais e 6 bilhões ativos.
Atingiu 100% de aproveitamento no benchmark miniF2F e resolveu 587 de 672 problemas do PutnamBench.
Estabeleceu novo estado da arte em álgebra avançada com 87% no FATE-H e 34% no FATE-X.
Custo operacional de US$ 4 por problema, significativamente inferior aos US$ 300 de modelos concorrentes.
Identificou 11 bugs reais em 57 repositórios de código aberto, sendo 5 deles inéditos.
Licenciado sob Apache 2.0, o modelo está disponível no Hugging Face e via API gratuita.

A Mistral AI anunciou o lançamento do Leanstral 1.5, um modelo de linguagem especializado em verificação formal na linguagem Lean 4. Projetado para atuar como um agente de engenharia de provas, o sistema utiliza uma arquitetura de Mixture of Experts (MoE) que permite alta performance em tarefas complexas de raciocínio lógico e matemático, mantendo apenas 6 bilhões de parâmetros ativos por token.

Além de seu desempenho superior em competições acadêmicas, como o PutnamBench, o Leanstral 1.5 demonstra utilidade prática na detecção de falhas em softwares reais. Ao integrar ferramentas como o Aeneas para tradução de código Rust, o modelo consegue inferir intenções de desenvolvedores e validar propriedades de segurança, superando métodos tradicionais de testes e fuzzing em casos de borda críticos.

Tópicos relacionados

Inteligência Artificial

Fontes