Modelo da Anthropic resolveu o cenário de 32 passos em 6 de 10 tentativas, à frente do GPT-5.5.
Uma versão de pré-lançamento do Claude Mythos, modelo da Anthropic, tornou-se a primeira IA a concluir os dois ambientes de ciberataque simulado do AI Security Institute do Reino Unido, que reproduzem ataques a pequenas redes corporativas sem defesa. O modelo resolveu o cenário de 32 passos, 'The Last Ones', em 6 de 10 tentativas, e o ambiente de tecnologia operacional 'Cooling Tower', até então não resolvido, em 3 de 10. O GPT-5.5, da OpenAI, fez o primeiro cenário em 3 de 10 e não terminou o segundo.
O instituto estima que a duração das tarefas de cibersegurança que esses modelos conseguem executar vem dobrando a cada 4,7 meses, uma aceleração frente à estimativa de 8 meses feita em novembro de 2025.
13 mai, 18:32
23 abr, 16:12
15 abr, 09:00
14 abr, 18:03
24 mar, 09:00
Carregando comentários...