Quão rápido avança a capacidade autônoma de ciberataque da IA?
AI Security Institute: o Claude Mythos Preview foi o primeiro modelo a concluir os dois 'cyber ranges' do instituto britânico, superando o GPT-5.5.
|
14/05 às 09:00
Pontos principais
- Mythos Preview resolveu 'The Last Ones' em 6 de 10 e 'Cooling Tower' em 3 de 10 tentativas
- Modelos recentes se beneficiam de forma desproporcional de orçamentos maiores de tokens
Mencionado nesta matéria
Organizações
AI Security InstituteAnthropicOpenAI
Lugares
United Kingdom
