GPT-5.4 da OpenAI reforça segurança em meio à concorrência acirrada
Help Net Security: GPT-5.4 marca 75% no OSWorld-Verified de navegação desktop contra 72,4% dos humanos.
|
06/03 às 09:00
Pontos principais
- OSWorld-Verified: 75% vs 72,4% dos humanos e 47,3% do GPT-5.2
- Avaliação Chain-of-Thought Controllability mostra baixa capacidade de obscurecer raciocínio
Mencionado nesta matéria
Pessoas
Sam Altman
Organizações
OpenAI
Lugares
San Francisco
