Introducing EVMbench
17 de fevereiro, 2026 às 21:00
OpenAI Blog
Resumo
OpenAI e Paradigm lançaram o EVMbench, um novo benchmark para avaliar a capacidade de agentes de IA em identificar, corrigir e explorar vulnerabilidades de alta gravidade em contratos inteligentes.
Pontos principais
- O EVMbench é um benchmark desenvolvido em colaboração pela OpenAI e Paradigm.
- Seu objetivo é testar a eficácia de agentes de IA na segurança de contratos inteligentes.
- O benchmark avalia a detecção, correção e exploração de vulnerabilidades críticas.
- A iniciativa visa melhorar a segurança no ecossistema de contratos inteligentes usando IA.
Entidades mencionadas
Organizações
OpenAI
Paradigm
