Claude Mythos é a primeira IA a concluir os do...

Pontos principais

Versão de pré-lançamento do Claude Mythos concluiu os dois ambientes de ciberataque simulado do AISI

Resolveu o cenário 'The Last Ones', de 32 passos, em 6 de 10 tentativas

GPT-5.5 fez o mesmo cenário em 3 de 10 e não terminou o segundo ambiente

Duração das tarefas de cibersegurança vem dobrando a cada 4,7 meses

Cada modelo recebe orçamento de até 100 milhões de tokens por tentativa

Uma versão de pré-lançamento do Claude Mythos, modelo da Anthropic, tornou-se a primeira IA a concluir os dois ambientes de ciberataque simulado do AI Security Institute do Reino Unido, que reproduzem ataques a pequenas redes corporativas sem defesa. O modelo resolveu o cenário de 32 passos, 'The Last Ones', em 6 de 10 tentativas, e o ambiente de tecnologia operacional 'Cooling Tower', até então não resolvido, em 3 de 10. O GPT-5.5, da OpenAI, fez o primeiro cenário em 3 de 10 e não terminou o segundo.

O instituto estima que a duração das tarefas de cibersegurança que esses modelos conseguem executar vem dobrando a cada 4,7 meses, uma aceleração frente à estimativa de 8 meses feita em novembro de 2025.

Claude Mythos é a primeira IA a concluir os dois testes de ciberataque do governo britânico

Pontos principais

Fontes

Quão rápido avança a capacidade autônoma de ciberataque da IA?

Leia também

OpenAI lança GPT-5.5-Cyber e amplia iniciativa de segurança Patch the Planet

GPT-5.5 supera Claude Fable 5 em novo benchmark de agentes de IA

Modelo de IA Mythos Preview supera GPT-5.5 em testes de cibersegurança

OpenAI lança GPT-5.4-Cyber para profissionais de cibersegurança verificados

OpenAI expande programa de cibersegurança com GPT-5.4-Cyber

Comentários

Claude Mythos é a primeira IA a concluir os dois testes de ciberataque do governo britânico

Pontos principais

Fontes

Quão rápido avança a capacidade autônoma de ciberataque da IA?

Leia também

OpenAI lança GPT-5.5-Cyber e amplia iniciativa de segurança Patch the Planet

GPT-5.5 supera Claude Fable 5 em novo benchmark de agentes de IA

Modelo de IA Mythos Preview supera GPT-5.5 em testes de cibersegurança

OpenAI lança GPT-5.4-Cyber para profissionais de cibersegurança verificados

OpenAI expande programa de cibersegurança com GPT-5.4-Cyber

Comentários