Claude Opus 4.5 lidera ranking de resistência a ataques adversariais; GPT-5.2 da OpenAI ficou em sétimo lugar.
A Cisco lançou o LLM Security Leaderboard na RSAC 2026, ranking abrangente de resistência de modelos de linguagem a ataques adversariais incluindo tentativas de jailbreak em turnos únicos e múltiplos. A Anthropic dominou com 8 das 10 primeiras posições — Claude Opus 4.5 em primeiro, Sonnet 4.5 em segundo e Haiku 4.5 em terceiro.
O GPT-5.2 da OpenAI ficou em sétimo lugar e o GPT 5 Nano em nono. Modelos da Mistral ocuparam as últimas posições. O leaderboard avalia ataques conversacionais multi-turno, onde atacantes tentam degradar as proteções do modelo ao longo de conversas mais longas — cenário que reflete melhor o comportamento adversarial no mundo real.
18 mar, 09:00
14 mar, 09:00
6 mar, 09:00
1 mar, 13:19
24 jul, 21:00