Daily Journal
Daily Journal

Quão rápido avança a capacidade autônoma de ciberataque da IA?

AI Security Institute: o Claude Mythos Preview foi o primeiro modelo a concluir os dois 'cyber ranges' do instituto britânico, superando o GPT-5.5.

Daily Journal
|
14/05 às 09:00

Pontos principais

  • Mythos Preview resolveu 'The Last Ones' em 6 de 10 e 'Cooling Tower' em 3 de 10 tentativas
  • Modelos recentes se beneficiam de forma desproporcional de orçamentos maiores de tokens

Mencionado nesta matéria

Organizações

AI Security InstituteAnthropicOpenAI

Lugares

United Kingdom